Meta AI实验室推三项新AI项目庆祝成立十周年:Ego-Exo4D、Audiobox等
**划重点:**
1. 🌐 **Ego-Exo4D:** Meta发布支持视频学习和多模态感知的数据集,涵盖运动、音乐、烹饪等复杂人类活动,可用于增强现实、机器学习和社交网络。
2. 💬 **Seamless Communication:** 推出四个AI研究模型,旨在跨越语言界限实现更自然、真实的表达和快速翻译,包括保留语音表达和语境的SeamlessExpressive等功能。
3. 🎶 **Audiobox:** Meta的新音频生成模型,通过语音输入和自然语言文本提示生成声音和音效,以创造定制的音频文件,为研究人员和学术机构提供先进的音频生成研究支持。
为庆祝Meta基础人工智能研究(FAIR)团队成立十周年,公司隆重推出三个创新的人工智能项目,展示了引人注目的演示。
Ego-Exo4D:
官方项目介绍网址:https://ai.meta.com/blog/ego-exo4d-video-learning-perception/
该项目以数据集及基准测试的形式呈现,旨在支持视频学习和多模态感知的人工智能研究。由Meta的FAIR、Project Aria,以及来自全球15所大学的合作伙伴在两年内共同收集,Ego-Exo4D捕捉了佩戴Project Aria头戴设备的参与者的“自我中心”视角和周围摄像机的“外部中心”视角。
这一数据集聚焦于复杂的人类活动,如运动、音乐、烹饪、舞蹈和自行车维修。Meta认为,该数据集在增强现实系统、机器人学习以及社交网络等领域具有广泛应用前景。1,400多小时的视频数据将于12月以开源形式发布,并计划于明年进行Ego-Exo4D公开基准竞赛。
Seamless Communication:
官方项目介绍网址:https://ai.meta.com/blog/seamless-communication/
该项目旨在通过四个AI研究模型实现更自然、真实的跨语言交流。包括保留语音表达和语境的SeamlessExpressive,以及提供约两秒延迟的语音和文本翻译的SeamlessStreaming。此外,SeamlessM4T v2是一个多语言、多任务的模型,用于轻松实现语音和文本之间的交流。最终,Seamless将集成SeamlessExpressive、SeamlessStreaming和SeamlessM4T v2的功能于一个模型中。
Meta还发布了SeamlessExpressive的演示,用户可以在其中将其语音翻译成其他语言,增强了跨语言沟通的交互性。
官方演示网址:https://seamless.metademolab.com/expressive/
Audiobox:
官方项目介绍网址:https://ai.meta.com/blog/audiobox-generating-audio-voice-natural-language-prompts/
这是Meta全新的音频生成模型,通过结合语音输入和自然语言文本提示,能够生成声音和音效,从而更轻松地创建用于不同用途的定制音频文件。相比其前身Voicebox,Audiobox通过允许用户使用自然语言提示来创建所需的声音或语音类型,提供了更强的可控性。
Meta表示,该模型将首先提供给一组选择的研究人员和学术机构,以推动音频生成研究的发展,并确保人工智能的负责任发展。
这三个项目的推出标志着Meta FAIR团队十年来在人工智能领域取得的巨大成就,并为未来的技术发展和创新奠定了坚实基础。
调查:仅有4%青少年和年轻人几乎每天使用AI工具
划重点:-📊仅有4%的受访者称他们每天或几乎每天使用人工智能工具-📚AI的两种最常见用途是获取信息和头脑风暴-🌐41%的受访者预计未来10年人工智能将产生积极和消极影响站长网2024-06-03 20:16:330000OpenAI 董事会邀请竞争对手加入,挖角谷歌Gemini高管
划重点:-OpenAI董事会邀请竞争对手加入,引发关于Altman地位的担忧。-谷歌为了留住人才,开出高额薪酬并推出特殊补偿计划。-OpenAI从谷歌Gemini团队挖角高管,进一步增强了其在人才和技术方面的优势。站长网2024-01-25 16:18:3500002024福布斯全球亿万富豪榜:LV老板蝉联首富 马斯克排第二
站长之家(ChinaZ.com)4月3日消息:近日,福布斯发布了备受瞩目的2024年全球亿万富豪榜,今年的榜单上共有2781位富豪入选,这一数字创下历史新高。这些上榜富豪的总财富达到了惊人的14.2万亿美元。站长网2024-04-08 12:41:40000036款游戏上半年流水曝光:14款流水过亿,3款花上亿买量
没想到越来越卷的SLG还有不小的上升空间,这是我观察上半年游戏流水后的第一个想法。随着上市游戏公司的半年报陆续发布,部分公司也公布了旗下主要游戏的流水数据。游戏新知整理出了36款游戏的相关数据,除了发现SLG依然能打之外,还能感觉到行情变化对公司决策的影响。随着研发和推广成本逐渐提升,游戏公司也越来越倾向于做多手准备,妥善分配支出,提前为未来做好打算。站长网2023-09-28 09:17:410000不急于加入AI战局的腾讯、搜狐,心境或许并不相同
生成式人工智能在2023年成为科技行业的关键词,显然已经是无可争议的事情。不提大洋彼岸,仅是在中国市场,不到三个月的时间里,诸如百度的文心一言、阿里的通义千问、网易的玉言、京东的ChatJD、360的“360智脑”及“360鸿图”,再加上商汤科技、科大讯飞、深兰科技等AI企业相关产品的陆续亮相,也让这条赛道可谓是“乱成一锅粥”了。站长网2023-05-22 09:22:170000