开源音频模型Stable Audio Open,文本生成47秒高清音效
站长网2024-06-06 17:42:590阅
6月6日,著名开源大模型平台Stability.ai在官网宣布,开源最新文生音频模型Stable Audio Open。
用户通过文本就能生成最多47秒,钢琴、笛子、鼓点、模拟人声等不同类型的44.1kHz音效。
值得一提的是,Stable Audio Open支持数据微调,歌手、音乐人可以让其生成基于自己的音乐数据,例如,架子鼓手可以根据自己的鼓点来进行微调。
开源地址:https://huggingface.co/stabilityai/stable-audio-open-1.0
在线demo:https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero
根据Stability.ai介绍,Stable Audio Open使用了486,492个录音训练数据,其中472,618个来自Freesound,13874个来自免费音乐档案馆,并且所有音频文件均根据 CC0、CC BY或CC Sampling 获得了商业许可。
就是说通过Stable Audio Open生成的音效无需担心商业化问题,不会受到法律方面的追究。
「AIGC开放社区」根据其提供的在线demo体验了一下,在文本语义理解、生成音效等方面还是相当优秀。
需要注意的是,目前只支持英文提示词,其他任何语言都不行,即便你使用了识别效果也是相当的差。
在生成的过程中,用户可以对时间、扩散步数和CFG进行详细控制,以达到更好的效果。例如,一首非常舒适抒情的钢琴曲。
此外,Stable Audio Open目前只能用于学术研究,还无法商业化。
0000
评论列表
共(0)条相关推荐
笔记带货、本地团购、AIGC种草,焦虑的小红书加速“狂飙”
小红书开放“笔记带货”的消息,在商家和博主圈里很快传开来。据悉,小红书设立了选品中心,由入驻商家发布商品、设置佣金,博主选择商品发布关联笔记,用户通过笔记下单成交,博主即可获得分佣。这一模式听起来并不陌生,事实上,它与抖音做本地生活采取的达人探店打法如出一辙。只不过,小红书把它用到了种草带货上。站长网2023-05-19 09:52:350000布局抖音直播间,“中国汉堡”塔斯汀如何拿捏年轻人?
塔斯汀开始向一线城市扩张。最近,塔斯汀在北京开店的消息在社交平台流传,不少网友已经晒出了自己打卡的照片。塔斯汀的社交影响力在各个平台均有所体现,小红书相关笔记超5万篇,B站多条测评视频播放量达百万,塔斯汀还曾拿下抖音本地生活团购带货榜销冠。塔斯汀圈粉年轻人的关键是什么?它在抖音本地生活的打法究竟是怎样的?以“中国化”打出品牌差异化站长网2023-09-19 14:24:520001ComfyUI图像放大插件SUPIR发布v2版本 加载速度更快了
近期,广受欢迎的ComfyUI图像放大插件SUPIR发布了其最新版本v2。新版本在多个方面进行了重大改进和优化,为用户带来了更高效、更灵活的使用体验。站长网2024-03-18 17:11:110000OpenAI“宫斗”新进展!Sam Altman将重返OpenAI担任首席执行官 董事会成员改动
##划重点:-🔄SamAltman宣布回归OpenAI,结束了经过五天的激烈讨论和辩论后的悬念。-🤝OpenAI达成了与Altman的“原则上的协议”,并进行了董事会改组,剔除了上周对Altman做出突然解雇决定的一些成员。-🌐微软,拥有OpenAI约49%的股份,对上周的决定感到震惊,并迅速聘请Altman领导其新的人工智能团队。站长网2023-11-22 15:11:160001粉丝光看不买?我学会了瑜大公子的促单成交术!
“我们需要随时审视我们所处的商业环境,在困境中寻找突破。”如果问直播电商从业者:现在的直播行业,是红海还是蓝海?我相信99.99%的回答不会是蓝海!从2016年蘑菇街上线视频直播开始,直播电商从新兴事物到品牌宠儿,从强势破圈到万亿市场,在过去的几年时间,整个行业经历了自我发展的冷静期。站长网2023-08-21 20:33:230000