意大利研究人员开发出一种生成模型能够进行音乐合成和源分离

站长网2023-07-21 17:06:410阅

一项来自意大利的新的人工智能研究介绍了一种基于扩散的生成模型，能够同时进行音乐合成和源分离。这种模型使用了源的联合概率密度作为先验分布进行训练，通过对先验进行采样来进行生成任务，通过将先验分布与混合物进行条件化并从结果的后验分布中进行采样来进行分离任务。

研究人员使用了 Slakh2100数据集进行实验，该数据集包含2100个音轨，是一个用于源分离的标准数据集。研究人员使用基于扩散的生成模型和得分匹配进行训练，并引入了一种基于 Dirac delta 函数的采样方法。

实验结果表明，该模型在分离任务上的性能与其他先进的回归模型相当。研究人员表示，当前可用的上下文数据量限制了算法的性能，并考虑使用预先分离的混合物作为数据集来解决这个问题。

总而言之，这项由 GLADIA Research Lab 提供的多源扩散模型在音乐领域的分离和总体以及部分生成方面是一种新的范例。研究人员希望他们的工作能够鼓励其他学者在音乐领域进行更深入的研究。

意大利研究人员开发出一种生成模型能够进行音乐合成和源分离

0000

评论列表

共(0)条

相关推荐

站长资讯
GPT-4太烧钱，微软想甩掉OpenAI？曝出Plan B：千块GPU专训「小模型」，开启必应内测
GPT-4太吃算力，微软被爆内部制定了PlanB，训练更小、成本更低的模型，进而摆脱OpenAI。GPT-4太吃算力，连微软也顶不住了!今年，无数场微软AI大会上，CEO纳德拉台前激动地官宣，将GPT-4、DALL·E3整合到微软「全家桶」。微软全系产品已被OpenAI的模型重塑，愿景是让AI成为每个人的生活伴侣。然而在幕后，因GPT-4运行成本太高，微软却悄悄地搞起了planB。
站长网2023-09-27 14:30:47
0000
站长资讯
百川智能开源Baichuan2 均可免费商用
百川智能发布了两款开源大模型Baichuan2-7B和Baichuan2-13B，参数分别为70亿和130亿，能力全面超越了Meta研发的Llama2-13B模型。同时，百川智能还发布了Baichuan2-13B-Chat与其4bit量化版本，并且均为免费可商用。
站长网2023-09-06 18:37:32
0000
站长资讯
在大模型数量全国领先的北京，昇腾AI“点燃”首个普惠算力底座
大模型在抹平AI模型底层架构多样性的同时，也在悄然抹去城区之间的差异。站在北京石龙经济开发区20号院，很难将这里与京西地区百年钢铁史、千年采煤史联系起来。曾是一代又一代人集体记忆的铁花飞溅、机械轰鸣，如今已化作蔚然成风的「京西智谷」。图源备注：图片由AI生成，图片授权服务商Midjourney
站长网2023-09-19 13:58:38
0000
站长资讯
苹果CEO库克发文庆祝iPhone 15在华发售：不可或缺
快科技9月23日消息，iPhone15系列现在已经正式发售，首发日非常火爆，8点前店门还没开就排上了长队。从销售情况来看，Pro系列明显要更受欢迎一些，尤其是ProMax版本，现在订购预计送货时间最早也要排到11月14日了。苹果CEO库克也喜闻乐见”这盛况，发文庆祝iPhone15系列、新AppleWatch、新AirPods在中国发售，并强调它们从未有像现在这样不可或缺”。
站长网2023-09-23 09:29:17
0000
站长资讯
华为Mate 70发布时间曝光：晚于小米15、iPhone 16
快科技7月30日消息，小米15会在10月下旬登场，跟高通骁龙峰会时间接近，该机将首发搭载骁龙8Gen4平台。博主数码闲聊站爆料，华为Mate70发布时间是11月份，晚于小米15、iPhone16系列。据悉，华为Mate70采用3D人脸识别侧边指纹双重解锁方案，屏幕正面是三挖孔设计，跟Mate60Pro保持一致。
站长网2024-07-30 10:30:45
0000