Meta 发布利用文本创作音乐的开源 AudioCraft AI:「可能是类比合成器的新型乐器」
Meta 周三推出了名为 AudioCraft 的开源人工智能工具,该工具将帮助用户根据文本提示创建音乐和音频。它允许用户完全通过生成式 AI 创作音乐和声音。

Meta 表示,该人工智能工具捆绑了 AudioGen、EnCodec 和 MusicGen 三个模型,适用于音乐、声音、压缩和生成。它补充说,MusicGen 使用公司拥有且专门授权的音乐进行培训。
三个 AI 模型分别处理声音生成的不同领域。MusicGen 通过文本输入生成音乐。该模型是在「Meta 拥有或专门用于此目的授权的 2 万个小时的音乐」上进行训练的。AudioGen 根据文本提示创建声音效果,如狗叫声或脚步声,它是在公共音效上进行训练的。Meta 改进了 EnCodec 解码器的版本,可以使用户使用较少的伪影来创建声音——当你过多操纵音频时会产生伪影。
艺术家和行业专家对侵犯版权提出了担忧,因为机器学习软件通过识别和复制从网络上抓取的数据中的模式来工作。
Meta 公司让媒体们听了一些使用 AudioCraft 制作的示例音频。口哨声、警笛声和嗡嗡声听起来非常自然。尽管歌曲中的吉他琴弦感觉很真实,但它们仍然感觉有点不自然。
Meta 只是最新处理音乐和 AI 结合的公司之一。今年早些时候,谷歌推出了 MusicLM,这是一个大型语言模型,可以根据文本提示生成几分钟的音乐,只对研究人员开放。然后,一首名为「AI 生成」的歌曲在得到病毒传播后被下架,这首歌曲中有 Drake 和 The Weeknd 的声音。最近,一些音乐家,比如 Grimes,鼓励人们在 AI 创作的歌曲中使用自己的声音。
然而,音乐家们一直在尝试电子音频很长一段时间了;电子舞曲和像 Ultra 这样的音乐节并不是凭空出现的。但是由计算机生成的音乐经常听起来像是从现有音频中处理出来的。AudioCraft 和其他生成式 AI 生成的音乐完全是根据文本和大量的声音数据生成的。
目前,AudioCraft 听起来更像是可以用作电梯音乐或背景歌曲,可以为环境增添氛围,而不是下一个流行热曲。然而,Meta 相信他们的新模型可以像合成器一样开创一波新的流行歌曲潮流,以及合成器在成为流行后如何改变了音乐。
「我们认为 MusicGen 可以变成一种新型乐器——就像合成器首次出现时一样」,该公司在博客中表示。Meta 承认,创建能够创作音乐的 AI 模型的困难,因为音频通常包含数百万个离散点,而不仅仅是像 Llama 2 这样的文本模型,只包含数千个点。
该公司表示,为了使其训练数据的多样性更加丰富,AudioCraft 需要进行开源。
「我们认识到,用于训练我们的模型的数据集缺乏多样性。尤其是用于训练的音乐数据集中,更多是西方风格的音乐,只包含以英文编写的音频文本对和元数据」,Meta 表示。「通过分享 AudioCraft 的代码,我们希望其他研究人员能够更容易地测试限制或消除生成模型中潜在偏见和误用的新方法」。
AudioCraft 开源模型 Gthub 页面:
https://github.com/facebookresearch/audiocraft
AI 入侵前端,哪类工程师最危险?
当GPT-4向大家展示了如何用十秒把一个网站的手绘草图变成功能齐全的网站,包括一些炫酷的js链接按钮,技惊四座。不可避免地,前端工程师们也被AI风暴卷到了。当我们把目光转向前端这个发展相对成熟的技术领域。去思考前端开发者们将如何被AI影响,是个有趣的问题还是令人心慌?站长网2023-05-12 20:40:340000拼多多成立大模型团队 招聘大模型领域人才
据Tech星球报道,拼多多成立了一个数十人的大模型团队,该团队将探索大模型在拼多多客服、对话等场景下的应用,并拓展至其旗下跨境电商平台TEMU的智能客服、搜索、推荐等业务场景。目前,整个进程仍处于研发阶段。拼多多已开始在大模型领域招聘人才,年薪百万的职位不在少数,最高可达130万元。站长网2023-11-22 09:17:320002AI视野:微软Bing Chat将引入DALL-E3;国内首例AI外挂案告破;Midjourney V6版本预计今年发布
📰🤖📢AI新鲜事微软必应聊天BingChat将引入OpenAI图像生成工具DALL-E3微软宣布将在BingChat中引入OpenAI的图像生成工具DALL-E3,通过集成ChatGPT技术,DALL-E3在处理图像内的文本方面表现更出色,用户可以免费使用该工具。AiBase提要:🚀微软将在BingChat中推出OpenAI的DALL-E3图像生成工具。站长网2023-09-22 17:20:370000Adobe 正致力于开发「Project Fast Fill」生成式人工智能视频处理技术
站长之家(ChinaZ.com)10月13日消息:Adobe正在展示一个名为ProjectFastFill的新的生成填充功能,它可以借助AI的力量轻松在视频中添加或删除对象。这是该公司在今年的MAX大会上宣布的几项新的实验性AI功能之一。ProjectFastFill能够在运动中更换人物的服装配饰或从风景画的背景中删除游客。站长网2023-10-13 12:01:310000官宣!小米人车家全生态将亮相2024 MWC
快科技2月14日消息,近日,小米官方在海外社交平台官宣,小米人车家全生态”将亮相于2024年西班牙巴塞罗那世界移动通讯展览会(MWC)。据悉,MWC是世界移动通信大会,由移动通信亚洲大会发起,全球移动通信系统协会主办。2024年MWC展会时间是2月26日-2月29日。据官方发布海报,今年MWC展会不仅有小米SU7、小米手机、还有智能家居。站长网2024-02-14 12:51:380000