VampNet:一种用于音乐合成、压缩、修复等AI音乐生成方法
站长网2023-07-18 19:02:070阅
由于离散声学标记建模的发展,最近在语音和音乐的自回归创建方面取得了重大改进。研究人员开发了一种名为 VampNet 的音乐生成方法,它利用了声学token建模和并行迭代解码的技术。
据称,VampNet 可以用于音乐合成、压缩、填充和变体等多个应用领域。
研究人员使用基于token的提示来指导 VampNet 的创作,展示了其填补空白的能力。VampNet 可以根据不同的提示设计产生音乐的变体,包括循环和变化。该方法可以在音乐压缩和音乐制作之间进行平滑过渡。
在适当的提示下,VampNet 能够保持音乐的风格、流派、乐器和其他高级方面,同时改变了音色和节奏的一些细微差别。他们的方法允许将提示放在任何地方,这与自回归音乐模型不同,自回归音乐模型只能通过利用一些原始音频作为提示并让模型扩展音乐内容。 这种灵活的提示能力使 VampNet 成为强大的音乐共同创作工具。
使用智能工具和模型预测自动进行标记以节省时间。音乐家可能会使用 VampNet 录制一个简短的循环,将其输入到系统中,并让 VampNet 在每次重复循环区域时根据这个想法生成音乐变体。
论文地址:https://arxiv.org/abs/2307.04686
0000
评论列表
共(0)条相关推荐
32专家MoE大模型免费商用!性能全面对标Llama3,单token推理消耗仅5.28%
每个token只需要5.28%的算力,精度就能全面对标Llama3。开源大模型,再添一位重量级选手——来自浪潮信息的32专家MoE模型,源2.0-M32。不仅拥有极高的回报投入比,而且全面开放,训练代码和模型权重都可任意下载,商业使用也免费、无需授权。那么,这到底是怎样的一款模型?1/19算力消耗,性能对标Llama3站长网2024-05-31 02:22:370000使用 Windows 11 上的生成式人工智能助理 Copilot:您能执行的所有操作都在这里
尽管有许多疑虑,人工智能——特别是从提示中生成文本和图像的生成式AI——继续被推广到我们日常使用的硬件和软件中。微软在这一领域一直很活跃,今年早些时候在其Bing搜索引擎中添加了AI聊天机器人功能,现在正在预览Windows11中的新CopilotAI助手早期版本。站长网2023-11-06 15:18:1900038人半年肝出开源版GPT-4o,0延迟演示全网沸腾!背后技术揭秘,人人免费用
【新智元导读】GPT-4o或许还得等到今年秋季才对外开放。不过,由法国8人团队打造的原生多模态Moshi,已经实现了接近GPT-4o的水平,现场演示几乎0延迟,AI大佬纷纷转发。没想到,「开源版」GPT-4o这么快就来了!昨夜,来自法国AI实验室kyutai放出首个实时原生多模态Moshi,效果演示堪比5月发布的GPT-4o。站长网2024-07-04 17:18:450000华为自研绘画软件天生会画App正式上线
华为在正在进行的鸿蒙智行享界S9及全场景新品发布会上,正式发布了天生会画App的正式版本。这款App专为华为鸿蒙平板电脑等设备优化,旨在提供"真实数字创作体验"。站长网2024-08-06 15:31:350000与 AI 聊天机器人交谈的可怕之处:ChatGPT 可以从匿名文本中准确「推断」个人详细信息
站长网2023-10-18 21:24:290000