Meta AI实验室推三项新AI项目庆祝成立十周年:Ego-Exo4D、Audiobox等
**划重点:**
1. 🌐 **Ego-Exo4D:** Meta发布支持视频学习和多模态感知的数据集,涵盖运动、音乐、烹饪等复杂人类活动,可用于增强现实、机器学习和社交网络。
2. 💬 **Seamless Communication:** 推出四个AI研究模型,旨在跨越语言界限实现更自然、真实的表达和快速翻译,包括保留语音表达和语境的SeamlessExpressive等功能。
3. 🎶 **Audiobox:** Meta的新音频生成模型,通过语音输入和自然语言文本提示生成声音和音效,以创造定制的音频文件,为研究人员和学术机构提供先进的音频生成研究支持。
为庆祝Meta基础人工智能研究(FAIR)团队成立十周年,公司隆重推出三个创新的人工智能项目,展示了引人注目的演示。
Ego-Exo4D:
官方项目介绍网址:https://ai.meta.com/blog/ego-exo4d-video-learning-perception/
该项目以数据集及基准测试的形式呈现,旨在支持视频学习和多模态感知的人工智能研究。由Meta的FAIR、Project Aria,以及来自全球15所大学的合作伙伴在两年内共同收集,Ego-Exo4D捕捉了佩戴Project Aria头戴设备的参与者的“自我中心”视角和周围摄像机的“外部中心”视角。
这一数据集聚焦于复杂的人类活动,如运动、音乐、烹饪、舞蹈和自行车维修。Meta认为,该数据集在增强现实系统、机器人学习以及社交网络等领域具有广泛应用前景。1,400多小时的视频数据将于12月以开源形式发布,并计划于明年进行Ego-Exo4D公开基准竞赛。
Seamless Communication:
官方项目介绍网址:https://ai.meta.com/blog/seamless-communication/
该项目旨在通过四个AI研究模型实现更自然、真实的跨语言交流。包括保留语音表达和语境的SeamlessExpressive,以及提供约两秒延迟的语音和文本翻译的SeamlessStreaming。此外,SeamlessM4T v2是一个多语言、多任务的模型,用于轻松实现语音和文本之间的交流。最终,Seamless将集成SeamlessExpressive、SeamlessStreaming和SeamlessM4T v2的功能于一个模型中。
Meta还发布了SeamlessExpressive的演示,用户可以在其中将其语音翻译成其他语言,增强了跨语言沟通的交互性。
官方演示网址:https://seamless.metademolab.com/expressive/
Audiobox:
官方项目介绍网址:https://ai.meta.com/blog/audiobox-generating-audio-voice-natural-language-prompts/
这是Meta全新的音频生成模型,通过结合语音输入和自然语言文本提示,能够生成声音和音效,从而更轻松地创建用于不同用途的定制音频文件。相比其前身Voicebox,Audiobox通过允许用户使用自然语言提示来创建所需的声音或语音类型,提供了更强的可控性。
Meta表示,该模型将首先提供给一组选择的研究人员和学术机构,以推动音频生成研究的发展,并确保人工智能的负责任发展。
这三个项目的推出标志着Meta FAIR团队十年来在人工智能领域取得的巨大成就,并为未来的技术发展和创新奠定了坚实基础。
谷歌的Bard在聊天机器人排名中击败了GPT-4
**划重点:**1.🚀Bard的GeminiPro版本在LMSYS聊天机器人榜上超越了GPT-4,标志着聊天机器人领域的重大变革。2.📈Bard现在是LMSYS榜上第二高分的聊天机器人,正在迎头赶上保持冠军的GPT-4Turbo。3.💡Bard的崛起得益于搭载谷歌最新的GeminiPro大型多模态模型,成为该榜上第二个获得超过1200分的模型。站长网2024-02-01 12:07:170000斯坦福大学提出RT-Sketch 手绘轮廓助机器人完成任务
要点:1、RT-Sketch提出了一种目标导向的操作策略,使用手绘草图作为视觉模仿学习中的目标规范方式。草图具有用户友好性,能够有效地帮助策略区分任务相关和任务无关的对象。站长网2023-11-08 11:30:040000想不起电影名字?Film Recommender只需通过简单文字描述即可匹配电影
FilmRecommender是一款电影个性化推荐与发现工具。它允许用户通过简单的文字描述,比如提供背景设定、情节、主题或演员等信息,来查找和发现感兴趣的电影。体验地址:https://filmfinder.ai/FilmRecommender具有以下核心功能和价值:1.个性化电影推荐站长网2023-08-28 10:15:130000马斯克专访:我宁愿亲眼见证AI毁灭人类
快科技6月20日消息,在2024年戛纳狮子国际创意节上,特斯拉与SpaceX的首席执行官埃隆马斯克接受了WPP首席执行官马克里德的专访。在这次深入的对话中,马斯克分享了他对人工智能未来发展的复杂看法,他的一些观点引发了广泛关注。马斯克认为,人工智能的发展是一个概率问题,他对此持有既乐观又悲观的态度,他引用了人工智能领域的领军人物杰夫辛顿的观点,认为存在10%到20%的可能性出现令人担忧的情境。0000小鹏汽车阶段性组织调整已完成
今日,小鹏汽车宣布,组织调整已完成。小鹏汽车在2022年度报告中显示,王凤英出任总裁,其他核心高管继续担任原有职位。小鹏汽车表示,“阶段性的组织架构调整已完成,在更精简、更高效运作的组织以及更有竞争力的人才体系下,我们对市场份额的增长和销量的恢复充满信心。”站长网2023-04-12 18:17:380000