AI日报:阿里对口型视频项目EMO开启内测;苹果官宣端侧小模型OpenELM;Open-Sora偷偷升级;微信发布AI工具小微助手
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、阿里对口型项目EMO开启内测 可将照片转为唱歌视频
阿里推出的对口型项目EMO开启内测,用户只需提供一张照片和语音模型即可定制数字人像,实现低成本高效率的数字人出镜体验。EMO模型具有简便操作、低成本、广泛适用性和自然表达等特点,通过强大的技术实现让用户体验到全新的数字人出镜体验。
【AiBase提要:】
🎤 简便操作: 用户只需提供一张照片和语音模型即可定制数字人像。
💰 低成本: EMO模型提供免费高效的解决方案,与其他产品相比成本更低。
🎨 广泛适用性: 不仅限于写实人像,还能生成3D模型和二次元漫画风格视频,满足不同用户需求。
内测申请地址:https://www.wjx.top/vm/exOVbr1.aspx#
2、苹果发布OpenELM小型AI模型
苹果发布了OpenELM,一系列小型AI模型,标志着公司在本地AI运行领域的重要进展。这些小型模型比大多数轻量级AI模型更小,适合在手机和笔记本等设备上运行。苹果暗示将AI引入iPhone等设备,展示了公司在人工智能领域的雄心。
【AiBase提要:】
⭐ OpenELM是一系列非常小的语言模型,在文本相关任务上表现高效。
⭐ OpenELM比大多数轻量级AI模型更小,分为不同规格,适合在各种设备上运行。
⭐ 苹果暗示AI功能将登陆公司设备,公司发布了多个AI模型,展示对AI领域的投入。
详情链接:https://top.aibase.com/tool/openelm
3、Open-Sora悄悄升级 支持16秒视频生成和720p分辨率
Open-Sora项目在开源社区悄悄更新,新增支持长达16秒的单镜头视频生成和720p分辨率,提供了多种视频生成需求的解决方案。技术报告详细介绍了新功能和模型架构,对STDiT架构进行了关键性改进,提高了训练稳定性和性能。项目在多阶段训练方法和统一的图生视频/视频生视频框架方面取得了显著进展。
【AiBase提要:】
🚀 Open-Sora新增支持16秒视频生成和720p分辨率,满足多种视频生成需求。
🔬 技术报告详细介绍了新功能和模型架构,改进了STDiT架构提高了训练稳定性和性能。
💡 项目采用多阶段训练方法和统一的图生视频/视频生视频框架,实现高质量视频生成。
详情链接:https://top.aibase.com/tool/open-sora
4、比Gemini Pro1.5强!可解读视频的多模态模型 Pegasus-1公测
Pegasus-1是视频语言基础模型的升级版本,在多个任务中取得显著成就,刷新了视频理解标准。该模型具有约17亿参数,通过数据优化、视频处理和训练技术提升,提供卓越的视频理解和生成文本能力。
【AiBase提要:】
🌟 Pegasus-1在视频理解领域取得新突破,比Gemini Pro1.5强,表现卓越。
🌟 产品特色功能包括数据优化、视频处理提升和训练技术改进,为模型性能提供强大基础。
🌟 在基准测试中,Pegasus-1胜过谷歌Gemini Pro等现有模型,在视频问答、对话和摘要等任务中展现出卓越性能。
详情链接:https://top.aibase.com/tool/pegasus-1API
5、微信发布桌面效率AI工具小微助手
微信最近推出了名为“小微助手”的桌面AI效率工具,通过自然语言处理技术提升用户工作效率。这款工具支持Windows和Mac操作系统,具备灵活搜索功能、内置实用工具和指尖助手功能,以及圈子功能和支持的对话服务。
【AiBase提要:】
🔍 小微助手提供灵活搜索功能,支持自然语言搜索电脑中指定文件夹的内容。
🛠️ 内置实用工具包括微信翻译、剪贴板管理、JSON魔方和闪念胶囊,增强日常助手功能。
🤖 指尖助手功能允许用户快速访问预设的快捷操作,如文本翻译和文本收藏,支持功能自定义。
详情链接:https://top.aibase.com/tool/xiaoweizhushou
注:目前微信已经在官网关闭了下载链接(具体原因未知)
6、超真实的虚拟试衣软件IDM-VTON 连衣服的褶子都那么真实
IDM-VTON虚拟试衣技术引起广泛关注,细节处理精细,用户能真实感受衣物质感和设计。技术高度真实感,复杂背景处理,一致性保持,纹理与图案精确再现。应用于时尚零售、个性化设计、在线试衣间等领域,为消费者提供便捷试衣方式,为设计师和零售商提供新展示销售手段。
【AiBase提要:】
👗 技术高度真实感,细节精细,带来接近现实的试衣体验。
🌟 复杂背景处理,保持试穿效果高质量,适用不同场景。
🔄 一致性保持,展示同一服装在不同体型下效果一致,纹理与图案精确再现。
项目地址:https://idm-vton.github.io/
试玩地址:https://top.aibase.com/tool/idm-vton
7、AI搜索引擎Perplexity.ai估值达10亿美元并发布新的企业产品
Perplexity.ai近期完成融资,估值达数十亿美元,推出企业服务“Enterprise Pro”,提高工作场所搜索准确性和效率。公司计划加速全球扩张,与SoftBank Corp.和德国电信合作推广人工智能功能。
【AiBase提要:】
⭐ 完成融资,估值达10亿美元,推出“Enterprise Pro”提高搜索准确性和效率
⭐ 与SoftBank Corp.和德国电信合作推广人工智能功能,加速全球扩张
⭐ 提供增强数据隐私、改善安全性、用户管理、SOC2认证、数据存储和单一登录等功能
详情链接:https://top.aibase.com/tool/perplexity-enterprise-pro
8、旷视发布HiDiffusion,SD生成速度更快,图片质量更高
旷视最近发布的HiDiffusion技术引起了业界广泛关注。这一技术能显著提升SD生成图像的分辨率和生成速度,允许图像分辨率高达4096×4096,同时提高生成速度1.5至6倍。HiDiffusion解决了对象重复和高计算负担问题,在生成高分辨率图像任务上取得卓越效果。
【AiBase提要:】
🚀 HiDiffusion技术提升SD生成图像分辨率和速度
🔍 HiDiffusion框架包含RAU-Net模块和MSW-MSA注意力机制
💡 应用HiDiffusion可将图像生成分辨率提高至4096×4096,速度提升1.5至6倍
详情链接:https://top.aibase.com/tool/hidiffusion
9、《这就是ChatGPT》登顶微信读书热搜榜第一名
这篇文章介绍了由斯蒂芬・沃尔夫拉姆(Stephen Wolfram)于2023年出版的《这就是ChatGPT》一书,深入剖析了OpenAI开发的人工智能聊天机器人程序ChatGPT,展示了它引起广泛关注的原因以及如何利用Wolfram|Alpha赋予其计算知识超能力。
【AiBase提要:】
🤖 ChatGPT是OpenAI开发的聊天机器人程序,于2022年11月发布。
📚 《这就是ChatGPT》解析了ChatGPT的内部机制和原理,以及如何生成有意义的文本。
💡 ChatGPT结合Wolfram|Alpha展示了其在计算知识方面的超能力。
10、AI电影制作平台Morph Studio正式向候补用户开放访问权限
Morph Studio正式向候补用户开放访问权限,引发广泛关注。平台新增视频生成角色一致性和配音生成功能,提升用户体验。用户可通过参考图像精细制作视频,使用音效模型丰富音频效果。Morph Studio与Stability AI合作,提供全新电影制作方式,一体化流程高效连贯。活跃用户社区是竞争优势,为平台发展提供动力。
【AiBase提要:】
🎥 视频生成角色一致性和配音生成功能提升用户体验
🖼️ 参考图像精细制作视频,音效模型丰富音频效果
🚀 与Stability AI合作,一体化流程高效连贯
产品入口:https://top.aibase.com/tool/morph-studio
点此加入候补名单:https://app.morphstudio.com/waitlist
11、AI视频生成工具ID-Animator:可保持角色一致生成视频动画
ID-Animator是一种零样本个性化视频生成方法,可根据单个参考面部图像生成个性化视频,无需额外训练。该方法结合控制网络,实现单帧或多帧控制图像与面部参考图像的融合生成视频。
【AiBase提要:】
⭐ 提出了一种零样本人类视频生成方法,可根据单个参考面部图像进行个性化视频生成
⭐ 引入面向身份的数据集构建流水线,提高身份信息在视频生成中的提取效率
⭐ 结合控制网络,实现单帧或多帧控制图像与面部参考图像的融合生成视频
详情链接:https://top.aibase.com/tool/id-animator
12、Nvidia CEO黄仁勋亲自向OpenAI交付第一台DGX H200
Nvidia CEO黄仁勋亲自向OpenAI交付首个Nvidia DGX H200,标志着AI技术和研究能力取得重大进展。这一举动彰显了人工智能行业两大巨头之间紧密的联系,为AI领域的发展带来新的希望和机遇。
【AiBase提要:】
⭐ Nvidia DGX H200作为最新、最先进的AI处理器,代表着人工智能技术的重要飞跃。
⭐ OpenAI获得DGX H200将提升研究能力,尤其在GPT-5模型的发展上。
⭐ DGX H200的推出将推动整个人工智能行业的进步,赋予研究人员和开发人员处理更雄心勃勃项目的能力。
13、LinkedIn调查显示:AI威胁下,女性工作更易被取代
在国际货币基金组织和LinkedIn的研究中发现,女性持有的工作更容易受人工智能影响,尤其在先进经济体中。女性面临更高风险,可能更容易被AI取代。文章指出,女性在快速发展的AI时代需要更多关注和支持以抵御工作变革和挑战。
【AiBase提要:】
⭐️ 女性持有的工作更容易受人工智能影响,尤其在先进经济体中。
⭐️ 约60%的工作可能受到AI影响,女性面临更高风险。
⭐️ 全球范围内,57%的女性工作可能被AI打乱,相较之下男性为43%。
滴滴程维:柳青升任永久合伙人 不再设总裁岗位
快科技5月19日消息,滴滴创始人、董事长兼CEO程维与滴滴联合创始人、董事兼总裁柳青联合发布内部全员信,宣布柳青升任公司永久合伙人。同时,柳青不再任董事和总裁,而在未来,滴滴公司也不再设置总裁岗位。升任永久合伙人后,柳青分管的部门和职责不变,并继续担任公司首席人才官,专注在公司人才、组织建设及社会责任工作上,并继续向董事长兼CEO程维汇报。0000阿里开源新语音模型,比OpenAI的Whisper更好!
阿里巴巴在Qwen-Audio基础之上,开源了最新语音模型Qwen2-Audio。Qwen2-Audio一共有基础和指令微调两个版本,支持使用语音向音频模型进行提问并识别内容以及语音分析。例如,让一位女生说一段话,然后识别她的年纪或解读她的心情;发布一段吵闹的声音,分析有哪些声音组成等。站长网2024-08-10 18:02:280000粉丝光看不买?我学会了瑜大公子的促单成交术!
“我们需要随时审视我们所处的商业环境,在困境中寻找突破。”如果问直播电商从业者:现在的直播行业,是红海还是蓝海?我相信99.99%的回答不会是蓝海!从2016年蘑菇街上线视频直播开始,直播电商从新兴事物到品牌宠儿,从强势破圈到万亿市场,在过去的几年时间,整个行业经历了自我发展的冷静期。站长网2023-08-21 20:33:230000联合国呼吁对学校人工智能工具的使用进行年龄限制
文章概要:1.联合国发出呼吁,要求制定严格规定,限制学校中的人工智能工具使用,特别是针对年龄较大的儿童。2.联合国教育机构警告公共当局尚未准备好应对在学校中推出的“生成”人工智能项目的道德问题。3.该指南强调,教师、学习者和研究人员的参与以及政府监管对确保人工智能工具的安全有效使用至关重要。站长网2023-09-07 18:19:450000亚马逊云服务CEO表示,没有云服务就没有人工智能
本文概要:1.亚马逊云服务(AWS)首席执行官亚当·塞利普斯基基表示,人工智能(AI)与云计算密不可分,没有云就没有AI。2.塞利普斯基认为,目前只有大约10%的潜在客户已经转向了云计算,云计算市场的增长潜力巨大。3.AWS正积极投入AI领域,但也面临一些挑战,如与竞争对手的云服务合作以及硬件供应短缺。站长网2023-08-09 10:33:280000