Meta AI实验室推三项新AI项目庆祝成立十周年:Ego-Exo4D、Audiobox等
**划重点:**
1. 🌐 **Ego-Exo4D:** Meta发布支持视频学习和多模态感知的数据集,涵盖运动、音乐、烹饪等复杂人类活动,可用于增强现实、机器学习和社交网络。
2. 💬 **Seamless Communication:** 推出四个AI研究模型,旨在跨越语言界限实现更自然、真实的表达和快速翻译,包括保留语音表达和语境的SeamlessExpressive等功能。
3. 🎶 **Audiobox:** Meta的新音频生成模型,通过语音输入和自然语言文本提示生成声音和音效,以创造定制的音频文件,为研究人员和学术机构提供先进的音频生成研究支持。
为庆祝Meta基础人工智能研究(FAIR)团队成立十周年,公司隆重推出三个创新的人工智能项目,展示了引人注目的演示。

Ego-Exo4D:
官方项目介绍网址:https://ai.meta.com/blog/ego-exo4d-video-learning-perception/

该项目以数据集及基准测试的形式呈现,旨在支持视频学习和多模态感知的人工智能研究。由Meta的FAIR、Project Aria,以及来自全球15所大学的合作伙伴在两年内共同收集,Ego-Exo4D捕捉了佩戴Project Aria头戴设备的参与者的“自我中心”视角和周围摄像机的“外部中心”视角。
这一数据集聚焦于复杂的人类活动,如运动、音乐、烹饪、舞蹈和自行车维修。Meta认为,该数据集在增强现实系统、机器人学习以及社交网络等领域具有广泛应用前景。1,400多小时的视频数据将于12月以开源形式发布,并计划于明年进行Ego-Exo4D公开基准竞赛。
Seamless Communication:
官方项目介绍网址:https://ai.meta.com/blog/seamless-communication/
该项目旨在通过四个AI研究模型实现更自然、真实的跨语言交流。包括保留语音表达和语境的SeamlessExpressive,以及提供约两秒延迟的语音和文本翻译的SeamlessStreaming。此外,SeamlessM4T v2是一个多语言、多任务的模型,用于轻松实现语音和文本之间的交流。最终,Seamless将集成SeamlessExpressive、SeamlessStreaming和SeamlessM4T v2的功能于一个模型中。

Meta还发布了SeamlessExpressive的演示,用户可以在其中将其语音翻译成其他语言,增强了跨语言沟通的交互性。
官方演示网址:https://seamless.metademolab.com/expressive/
Audiobox:
官方项目介绍网址:https://ai.meta.com/blog/audiobox-generating-audio-voice-natural-language-prompts/
这是Meta全新的音频生成模型,通过结合语音输入和自然语言文本提示,能够生成声音和音效,从而更轻松地创建用于不同用途的定制音频文件。相比其前身Voicebox,Audiobox通过允许用户使用自然语言提示来创建所需的声音或语音类型,提供了更强的可控性。

Meta表示,该模型将首先提供给一组选择的研究人员和学术机构,以推动音频生成研究的发展,并确保人工智能的负责任发展。
这三个项目的推出标志着Meta FAIR团队十年来在人工智能领域取得的巨大成就,并为未来的技术发展和创新奠定了坚实基础。
面对AI音乐恐慌,人类艺术家们决定反抗
从ChatGPT全球爆红开始,各种AI翻唱开始涌现。在国外,AIRihanna开始演唱Beyonce的歌,AIKanye正在翻唱PlainWhiteT's《HeyThereDelilah》;在国内,B站上的AI王心凌正在唱《套马杆》,AI孙燕姿正在唱《七里香》。站长网2023-04-26 09:20:210000拒绝“白嫖”!Stack Overflow 将矛头直指 ChatGPT 等产品:用了我的数据训练,得先给钱!
打不过就加入!继去年12月StackOverflow称ChatGPT生成的答案正确率非常低并决定宣布临时封禁ChatGPT之后,其开始以另一种身份加入这场AI竞赛中。站长网2023-04-24 16:28:300000百川智能A1轮已获阿里腾讯小米等3亿美元投资
百川智能宣布,已完成A1轮战略融资,融资金额3亿美元,阿里、腾讯、小米等科技巨头及多家顶级投资机构均参与了本轮融资。加上天使轮的5000万美元,百川智能的融资金额已达3.5亿美元。据了解,百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。其核心团队由来自搜狗、Google、腾讯、百度、华为、微软、字节等知名科技公司的AI顶尖人才组成。站长网2023-10-18 23:08:080000OPPO A2发布 搭载天玑6020售价1699元起
OPPO今日推出了全新的OPPOA2手机,售价1699元起。这款手机搭载了天玑6020移动平台,采用7nm制程节点,最高主频可达2.2Ghz,并配备了Mali-G57MC2950Mhz的GPU,支持5G双卡双待功能。站长网2023-11-03 14:59:370000抖音推出作品修改功能 作者可修改违规或待优化内容
抖音推出了一项新的作品修改功能,目前该功能仅对粉丝量超过10万的创作者和部分受邀创作者开放测试,并计划未来向更多用户开放。当创作者的作品被提示存在违规或待优化内容时,他们可以通过通知消息进入修改编辑页进行修改。修改编辑页面提供了剪切内容、添加文字说明和使用贴纸遮挡等功能。作品在发布24小时内允许修改一次,修改后的作品会标记为已编辑,并且原作品的互动数据如播放、点赞、转发和评论都将保留。站长网2024-07-30 08:53:570000