Meta 发布利用文本创作音乐的开源 AudioCraft AI:「可能是类比合成器的新型乐器」
Meta 周三推出了名为 AudioCraft 的开源人工智能工具,该工具将帮助用户根据文本提示创建音乐和音频。它允许用户完全通过生成式 AI 创作音乐和声音。

Meta 表示,该人工智能工具捆绑了 AudioGen、EnCodec 和 MusicGen 三个模型,适用于音乐、声音、压缩和生成。它补充说,MusicGen 使用公司拥有且专门授权的音乐进行培训。
三个 AI 模型分别处理声音生成的不同领域。MusicGen 通过文本输入生成音乐。该模型是在「Meta 拥有或专门用于此目的授权的 2 万个小时的音乐」上进行训练的。AudioGen 根据文本提示创建声音效果,如狗叫声或脚步声,它是在公共音效上进行训练的。Meta 改进了 EnCodec 解码器的版本,可以使用户使用较少的伪影来创建声音——当你过多操纵音频时会产生伪影。
艺术家和行业专家对侵犯版权提出了担忧,因为机器学习软件通过识别和复制从网络上抓取的数据中的模式来工作。
Meta 公司让媒体们听了一些使用 AudioCraft 制作的示例音频。口哨声、警笛声和嗡嗡声听起来非常自然。尽管歌曲中的吉他琴弦感觉很真实,但它们仍然感觉有点不自然。
Meta 只是最新处理音乐和 AI 结合的公司之一。今年早些时候,谷歌推出了 MusicLM,这是一个大型语言模型,可以根据文本提示生成几分钟的音乐,只对研究人员开放。然后,一首名为「AI 生成」的歌曲在得到病毒传播后被下架,这首歌曲中有 Drake 和 The Weeknd 的声音。最近,一些音乐家,比如 Grimes,鼓励人们在 AI 创作的歌曲中使用自己的声音。
然而,音乐家们一直在尝试电子音频很长一段时间了;电子舞曲和像 Ultra 这样的音乐节并不是凭空出现的。但是由计算机生成的音乐经常听起来像是从现有音频中处理出来的。AudioCraft 和其他生成式 AI 生成的音乐完全是根据文本和大量的声音数据生成的。
目前,AudioCraft 听起来更像是可以用作电梯音乐或背景歌曲,可以为环境增添氛围,而不是下一个流行热曲。然而,Meta 相信他们的新模型可以像合成器一样开创一波新的流行歌曲潮流,以及合成器在成为流行后如何改变了音乐。
「我们认为 MusicGen 可以变成一种新型乐器——就像合成器首次出现时一样」,该公司在博客中表示。Meta 承认,创建能够创作音乐的 AI 模型的困难,因为音频通常包含数百万个离散点,而不仅仅是像 Llama 2 这样的文本模型,只包含数千个点。
该公司表示,为了使其训练数据的多样性更加丰富,AudioCraft 需要进行开源。
「我们认识到,用于训练我们的模型的数据集缺乏多样性。尤其是用于训练的音乐数据集中,更多是西方风格的音乐,只包含以英文编写的音频文本对和元数据」,Meta 表示。「通过分享 AudioCraft 的代码,我们希望其他研究人员能够更容易地测试限制或消除生成模型中潜在偏见和误用的新方法」。
AudioCraft 开源模型 Gthub 页面:
https://github.com/facebookresearch/audiocraft
开放180天,视频号本地生活到底能不能玩?
视频号本地生活,任重道远。10月底,一条关于视频号本地生活的传闻不胫而走——第三方平台停止内测,将不能上架新商品。该消息迅速在商家圈子传播开来,引发诸多热议。知情者称,因视频号本地生活内测结束,一部分第三方平台将被下架,但按照现行标准入驻的第三方平台,不受影响。亿邦动力调查发现,美团、携程和同程等头部平台正常运营,而联联周边游、享库生活、近券、太目等已从优选联盟下架。0000MidReal AI更新Beta版本 官网上线推荐小说页面
AI小说生成工具MidRealAI最新更新了Beta版本,不仅更新了模型,还增加了许多新功能。新模型生成的内容更有逻辑,更连贯。同时,官网上线了小说展厅,用户可以在官网上查看推荐的小说,比在Discord上阅读更加舒适。此外,还增加了新功能,比如使用“/start_private”命令可以创建完全私密的内容,让用户不用担心发布的提示词导致自己社交媒体上的尴尬。站长网2024-01-03 09:49:510000京东外卖“低佣”入局,美团回应“30%高佣”质疑
近日,有关京东外卖以“只抽5%的佣金”为旗号上线,美团降低高佣金应对的消息在社交媒体上广泛传播,引发了公众对外卖平台佣金问题的关注。据21世纪经济报道,京东在外卖领域的布局早已开始。早在2022年,京东零售CEO辛利军就曾表示考虑进军外卖业。去年,京东App上线“秒送”频道,设置外卖功能入口,随后咖啡、奶茶、品牌连锁餐饮等陆续上线。0000Meta的MyoSuite2.0通过机器学习模仿幼儿移动
由MetaAI发布的MyoSuite2.0系列,与加拿大麦吉尔大学、美国东北大学和荷兰特文特大学的研究人员合作新项目。该项目将机器学习应用于生物力学控制问题,目的是展示人类水平的灵巧和敏捷。手臂和腿部是该团队迄今为止创建的最生理复杂的模型,协调大型和小型肌肉群是一个相当棘手的控制问题。该平台包括了一系列基线肌骨模型和开源基准任务,供研究人员尝试。站长网2023-08-16 09:25:200000从GPT-5到AI芯片厂,山姆·奥特曼在下一盘多大的棋?
这一次OpenAI的野心真的太大了。大规模招商,打造全球AI芯片厂随着OpenAI估值逼近1000亿大关,山姆·奥特曼的野心再也藏不住了。他不再满足于血拼谷歌和苹果,而是直接向算力霸主英伟达开战。0000