意大利研究人员开发出一种生成模型 能够进行音乐合成和源分离
站长网2023-07-21 17:06:410阅
一项来自意大利的新的人工智能研究介绍了一种基于扩散的生成模型,能够同时进行音乐合成和源分离。这种模型使用了源的联合概率密度作为先验分布进行训练,通过对先验进行采样来进行生成任务,通过将先验分布与混合物进行条件化并从结果的后验分布中进行采样来进行分离任务。
研究人员使用了 Slakh2100数据集进行实验,该数据集包含2100个音轨,是一个用于源分离的标准数据集。研究人员使用基于扩散的生成模型和得分匹配进行训练,并引入了一种基于 Dirac delta 函数的采样方法。
实验结果表明,该模型在分离任务上的性能与其他先进的回归模型相当。研究人员表示,当前可用的上下文数据量限制了算法的性能,并考虑使用预先分离的混合物作为数据集来解决这个问题。
总而言之,这项由 GLADIA Research Lab 提供的多源扩散模型在音乐领域的分离和总体以及部分生成方面是一种新的范例。研究人员希望他们的工作能够鼓励其他学者在音乐领域进行更深入的研究。
0000
评论列表
共(0)条相关推荐
钉钉工作台支持「 AI 生成应用图标」 可快速更换风格
钉钉工作台宣布新增功能,支持AI生成应用图标,让用户可以快速更换工作台图标的风格。主要内容包括:支持AI批量生成图标:管理员可以在工作台设置中选择“生成图标”,然后按需选择合适的风格和颜色。共有5种风格,每种风格都有7种颜色。用户可以先预览效果,确认后生成所有图标,省时高效。同时还可以保留图标替换记录,可以随时恢复历史效果。站长网2024-03-12 08:47:590000谷歌推出 ImageFX:具有表达芯片的文本到图像工具
谷歌正在推出一系列关于生成人工智能的更新,包括一个新的文本到图像工具。ImageFX的不同之处在于它有一个具有“表达芯片”功能的界面。站长网2024-02-02 11:54:270000AI初创公司必有科技完成种子轮融资
近日,成都初创前沿AI科技公司必有科技已宣布完成了种子轮融资,新的资金将用于产品研发、人才引进和市场建设。据官方显示,必有科技成立于2023年,是一家行业领先的专注于研究和开发前沿人工智能技术及产品的AI科技公司,总部位于四川成都。旗下biUAI是全球首个面向保险前端销售人员的革命性AI产品。站长网2023-08-22 01:06:260002荣耀Magic 6引入AI功能 可通过眼睛凝视控制手机
要点:1.华为荣耀(Honor)的新手机荣耀Magic6将引入一项名为MagicCapsule的眼动追踪技术,允许用户通过凝视来控制手机。2.MagicCapsule被描述为“基于眼动的多模交互技术”,虽然名称略显夸张,但这一功能有望提供全新的手机操作体验。站长网2023-10-26 17:04:310000OpenAI 为 DALL-E3添加新水印 以增强数字信息的可信度
随着越来越多的公司支持内容来源和真实性联盟(C2PAImage)标准,OpenAI的生成器DALL-E3将将图像为元数据添加水印。这些水印将出现在ChatGPT网站和DALL-E3模型的API生成的图像中,帮助用户验证图像的来源和制作工具。站长网2024-02-07 09:45:510000