Meta发布AI音频模型Audiobox:通过语音和自然语言提示生成音频
划重点:
🔊 Audiobox是Meta推出的新一代音频生成研究模型,结合语音输入和自然语言文本提示,可轻松创建定制音频。
🔊 作为Voicebox的继任者,Audiobox进一步推动音频生成领域,统一了语音、音效和音景的生成和编辑能力。
🔊 为了推动领域的进步并确保负责任的研究,Meta将向研究人员和学术机构提供资金,用于Audiobox的安全和责任研究。
Meta最新发布了Audiobox,这是一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从而为多种用例提供定制音频。
Audiobox是Voicebox的继任者,进一步推动了音频生成领域的发展。与Voicebox相比,Audiobox具有更强大的可控性,用户可以使用文本描述提示来指定语音和音效的风格,这是Voicebox不支持的功能。通过同时使用语音输入和文本提示,用户可以实现自由形式的语音重塑,这在当前的模型中尚属首次。

这款模型的独特之处在于,它允许用户使用自然语言提示描述他们想要生成的声音或语音类型。例如,如果有人想要生成一片音景,他们可以给模型一个文本提示,如“一条奔流的河流和鸟儿的鸣叫”。
Audiobox不仅在语音生成方面表现出色,还在音效生成方面表现出色。经过内部测试,Audiobox在质量和相关性方面明显超过先前的最佳模型,并在主观评估中以超过30%的样式相似性优势击败了Voicebox。
为了促进领域的发展并确保研究的负责任性,Meta计划邀请研究人员和学术机构申请资金,用于Audiobox的安全和责任研究。这一举措反映了他们对AI创新的关切,强调了与研究社区合作的重要性。
Audiobox的推出标志着音频生成领域的一项重要进展,Meta希望通过这一创新降低音频创作的门槛,使任何人都能轻松成为音频内容创作者。这对于视频、播客、游戏等多种用例都具有潜在的影响,为未来的音频创作开辟了新的可能性。
商汤科技宣布“商汤日日新”大模型体系全面升级
商汤科技于近日举办了名为“大爱无疆·日日新”的人工智能论坛。在此次论坛上,商汤科技宣布了对“商汤日日新SenseNova”大模型体系的全方位升级更新。据商汤科技介绍,商汤日日新SenseNova体系下的大模型产品更新和落地成果包括以下几点:站长网2023-07-08 14:06:190000戴尔高管透露,Nvidia正在研发一款耗能高达1000W的GPU B100
划重点:-🔥Nvidia计划推出功耗高达1000W的B100AI加速器,比之前的产品多出42%的功耗。-💧Dell高管表示,虽然GPU的功耗将持续增加,但直接液冷可能不再是必需的解决方案。-📈Nvidia的新一代GPU计划中可能包括B200Superchip,预计将结合GraceCPU,功耗或将达到1300瓦左右。0000微软将 Meta 的新 AI 大语言模型 Llama 2 提供给 Azure 客户:不再依赖 OpenAI
微软在人工智能领域投资了数十亿美元,与OpenAI合作,在搜索和其他关键产品中使用其聊天机器人技术。但微软明确表示,在生成式人工智能方面,并不仅仅依赖OpenAI。在周二的Inspire大会上,微软宣布将Meta的新人工智能大语言模型「Llama2」提供给其Azure云计算服务。站长网2023-07-19 19:18:290000麻省理工学院的新人工智能模型检测胰腺癌的早期迹象
麻省理工学院(MITCSAIL)的人工智能实验室与哈佛大学放射肿瘤学系的LimorApelbaum博士合作,提出了两种新的人工智能模型,称为PRISM神经网络(PrismNN)和逻辑回归(PrismLR),用于早期检测胰腺导管腺癌(PDAC),这是一种致命的癌症。图源备注:图片由AI生成,图片授权服务商Midjourney发现的重要性站长网2024-01-19 15:42:320000百度与孚宝智能合作 百度灵医大模型将接入孚宝机器人
近日,百度灵医智惠与浙江孚宝智能科技有限公司签署战略合作协议。双方将发挥各自技术、产品、市场优势,推动医疗康养机器人的技术创新和服务升级,为智慧康养产业注入创新动能。站长网2023-11-30 09:42:200000