开源音频模型Stable Audio Open,文本生成47秒高清音效
站长网2024-06-06 17:42:593阅
6月6日,著名开源大模型平台Stability.ai在官网宣布,开源最新文生音频模型Stable Audio Open。
用户通过文本就能生成最多47秒,钢琴、笛子、鼓点、模拟人声等不同类型的44.1kHz音效。
值得一提的是,Stable Audio Open支持数据微调,歌手、音乐人可以让其生成基于自己的音乐数据,例如,架子鼓手可以根据自己的鼓点来进行微调。
开源地址:https://huggingface.co/stabilityai/stable-audio-open-1.0
在线demo:https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero
根据Stability.ai介绍,Stable Audio Open使用了486,492个录音训练数据,其中472,618个来自Freesound,13874个来自免费音乐档案馆,并且所有音频文件均根据 CC0、CC BY或CC Sampling 获得了商业许可。
就是说通过Stable Audio Open生成的音效无需担心商业化问题,不会受到法律方面的追究。
「AIGC开放社区」根据其提供的在线demo体验了一下,在文本语义理解、生成音效等方面还是相当优秀。
需要注意的是,目前只支持英文提示词,其他任何语言都不行,即便你使用了识别效果也是相当的差。
在生成的过程中,用户可以对时间、扩散步数和CFG进行详细控制,以达到更好的效果。例如,一首非常舒适抒情的钢琴曲。
此外,Stable Audio Open目前只能用于学术研究,还无法商业化。
0003
评论列表
共(0)条相关推荐
2026日本亚运会项目敲定:电子竞技再入选
7月9日消息,杭州亚运会即将开幕,电子竞技首次成为正式比赛项目,参赛者的成绩将计入奖牌榜。这对于电子竞技来说,具有重大的里程碑意义。最近,日本爱知名古屋亚组委确认,第20届亚运会将于2026年在日本举行,共设有41个项目。站长网2023-07-10 09:15:450002AI视频后期制作神器ProPainter 一键即可完成视频抠图
最近,出现了一种新的视频修复技术,叫做ProPainter,它可以用画家风格的笔触来填补视频中的缺失区域。ProPainter是一个基于深度学习的端到端的网络,它由两个模块组成:RecurrentFlowCompletionNetwork和PainterlyRenderingNetwork。项目地址:https://github.com/sczhou/ProPainter站长网2023-10-24 22:12:290001OpenAI 发布 ChatGPT 官方 App 大更新:支持 iPad、Siri 和快捷指令
OpenAI发布的ChatGPT官方iOS应用程序迎来了重大更新。该应用程序已经在上个月登陆了美国、英国、法国、德国和韩国等AppStore,并且成为该市场上最受欢迎的免费应用程序。站长网2023-06-09 19:25:540002独立开发变现周刊:一个 AI 个人穿搭App年收入300万美元
目录1、PDFGuruAnki:一款开源以PDF为中心的办公学习工具箱2、Langflow:一个开源构建多代理和RAG应用程序的可视化框架3、【粉丝自荐】Color4Bg:一款酷炫的背景图生成工具4、如何通过Telegram频道实现每月收入5千美金5、AI个人穿搭工具年收入300万美元1、PDFGuruAnki:一款开源以PDF为中心的办公学习工具箱站长网2024-07-19 12:37:380000单品日销近1000w!618开门红哪些战绩值得关注?
伴随消费回暖、信心恢复,2023年618大促被赋予了更积极的期待。促销的号角已在各大平台吹响,抖音也于5月25日正式进入火热预售期。站长网2023-05-31 21:00:320000