首页站长资讯Meta发布AI音频模型Audiobox：通过语音和自然语言提示生成音频

Meta发布AI音频模型Audiobox：通过语音和自然语言提示生成音频

站长网2023-12-01 10:25:170阅

划重点:

🔊 Audiobox是Meta推出的新一代音频生成研究模型，结合语音输入和自然语言文本提示，可轻松创建定制音频。

🔊 作为Voicebox的继任者，Audiobox进一步推动音频生成领域，统一了语音、音效和音景的生成和编辑能力。

🔊 为了推动领域的进步并确保负责任的研究，Meta将向研究人员和学术机构提供资金，用于Audiobox的安全和责任研究。

Meta最新发布了Audiobox，这是一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示，Audiobox可以轻松生成各种声音，包括语音、音效和音景，从而为多种用例提供定制音频。

Audiobox是Voicebox的继任者，进一步推动了音频生成领域的发展。与Voicebox相比，Audiobox具有更强大的可控性，用户可以使用文本描述提示来指定语音和音效的风格，这是Voicebox不支持的功能。通过同时使用语音输入和文本提示，用户可以实现自由形式的语音重塑，这在当前的模型中尚属首次。

这款模型的独特之处在于，它允许用户使用自然语言提示描述他们想要生成的声音或语音类型。例如，如果有人想要生成一片音景，他们可以给模型一个文本提示，如“一条奔流的河流和鸟儿的鸣叫”。

Audiobox不仅在语音生成方面表现出色，还在音效生成方面表现出色。经过内部测试，Audiobox在质量和相关性方面明显超过先前的最佳模型，并在主观评估中以超过30%的样式相似性优势击败了Voicebox。

为了促进领域的发展并确保研究的负责任性，Meta计划邀请研究人员和学术机构申请资金，用于Audiobox的安全和责任研究。这一举措反映了他们对AI创新的关切，强调了与研究社区合作的重要性。

Audiobox的推出标志着音频生成领域的一项重要进展，Meta希望通过这一创新降低音频创作的门槛，使任何人都能轻松成为音频内容创作者。这对于视频、播客、游戏等多种用例都具有潜在的影响，为未来的音频创作开辟了新的可能性。

Meta发布AI音频模型Audiobox通过语音和自然语言提示生成音频

0000

评论列表

共(0)条

相关推荐

“20CM”涨停丰立智能收深交所关注函
北京商报讯（记者丁宁）5月22日晚间，深交所官网显示，丰立智能（301368）收到了深交所下发的关注函。据了解，5月20日、22日，丰立智能在互动易回复投资者称“公司生产的精密减速器产品可以应用在人型机器人上”“公司下步发展中心以钢齿轮为主线，延伸到用于机器人行业的精密减速器及新能源汽车行业的动力传动齿轮、汽车的座舱智能驱动等产品”。
站长网站长资讯2023-05-24 18:47:25
0000
站长资讯
首个开源中文金融大模型来了！解释授信额度、计算收益率、决策参考样样通，来自度小满｜附下载
金融行业正迎来大模型时代。近日，度小满正式发布千亿级中文对话大模型轩辕，集中文、金融、开源特色于一身。基于BLOOM-176B研发的轩辕大模型，在金融场景中的任务评测中，效果相较于通用大模型大幅提升，表现出明显的金融领域优势。
站长网2023-05-27 14:48:32
0000
站长资讯
10年烧掉47亿，欧盟「人脑计划」宣告失败？算法重建人类大脑遥不可及，成果支离破碎
【新智元导读】十年，欧盟的人脑计划即将到期，然而烧光47亿后，成果依然支离破碎，重建人类大脑的雄伟计划似乎仍然遥不可及。十年前，欧洲的科学家们计划在巨型计算机中重建人脑。十年后，欧盟的6亿欧元多半是打了水漂。在这个叫做HumanBrainProject（简称HBP）的计划里，欧盟投入了将近47亿人民币。有超过500名顶尖科学家，发表了数千篇论文。
站长网2023-08-24 11:44:03
0000
快时尚行至岔路口：涨高价，开大店，差异化
2024年行至尾声，快时尚行业的剧烈变革仍在继续。承压多时的几个老牌快时尚巨头相继复苏——12月11日，ZARA母公司Inditex集团公布三季度报，前三季度总营收同比增长7.1%至274亿欧元，净利润则同比增长8.5%至44亿欧元，多项经营指标均有所改善。优衣库母公司2024财年年报也不乏亮点，营收同比增长12.2%至3.1万亿日元，营业利润更是同比大涨31.4%至5009亿日元。
站长网站长资讯2024-12-26 14:06:28
0001
站长资讯
一批亚马逊卖家冲进TikTok Shop清货……
TikTokShop美国小店就像是一枚水雷，在今年跨境电商冲刺季到来之时炸开了行业原本平静的湖面。
站长网2023-11-08 20:37:05
0000