媲美Suno、Udio!AI铁了心,要砸音乐人的饭碗
5月10日凌晨,著名语音生成式AI平台ElevenLabs在社交平台宣布,推出文本生成歌曲产品ElevenLabs Music。
从其展示的效果来看,音乐的节奏感、和声、乐器的搭配、情感表达、创意性、风格的多样性、高/低音,可媲美该领域的两款头部产品Suno和Udio。
特别是人声独唱部分,清晰度、拟人化和乐器的融合度超过了那两款产品。这是因为ElevenLabs就是靠语音克隆起家的,在研究人声方面更专业,并且积累了海量超29种语言的语音,为训练AI模型提供了极大帮助。
本以为Sora的出现会改变影视、游戏领域的创作方式,没想到最先被变革的却是音乐领域,铁了心要砸音乐人的饭碗。
Suno、Udio、ElevenLabs Music产品对比
ElevenLabs Music在社交平台展示了通过文本生成的多首音乐。
歌曲名:《伤透我的心》
文本描述:平滑的当代 R&B 音乐,带有微妙的电子元素,拍子为104BPM 的鼓机节拍,过滤的合成器,华丽的电钢琴和高亢的弦乐,营造出亲密的氛围。
歌曲名:《我的爱》
文本描述:90年代摇滚风格,沧桑的嗓音结合清晰的吉他,强劲的鼓点和突出的贝斯线,中等的120BPM 节奏,混合亢奋的情绪唤起怀旧和希望的感觉。
下面在给大家听两首Suno和Udio生成的歌曲,来评价下这三家平台各自的产品特点。
Udio生成的是一首女声摇滚风格,关于爱情的歌曲。
Suno生成的一首怀旧摇滚风格,是关于描述区块链、AI、数字金融的歌曲。
这里可以明显听出来,ElevenLabs Music的人声更通透、清晰一些。
如果没有人提醒,相信多数人很难能听的出来上面所有音乐是AI自动生成的吧。这些产品可以帮助普通人实现当“歌手”的梦想,你只需要写出详细的歌曲文本描述,其他的交给AI即可。
此外,对于那些需要创作灵感的专业音乐人来说帮助也是巨大的,可以从AI生成的音乐中找出创作灵感。其实早期的80、90年代的歌坛就是互相借鉴来创作出不同的音乐作品。
ElevenLabs介绍
ElevenLabs是一家「AIGC开放社区」介绍多次的生成式AI语音平台,由前谷歌工程师Piotr Dąbkowski 和Palantir部署策略师Mateusz Staniszewski于2022年共同创立。曾在今年1月22日获得8000万美元B轮融资。
ElevenLabs的主打产品有语音克隆、文本转语音、AI配音等,支持中文、英文、日文、韩文等29种主流语言。
产品免费体验地址:https://elevenlabs.io/text-to-speech
语音克隆:用户只需上传一段1分钟—30分钟的样板音频,ElevenLabs就能生成几乎和原声一模一样的音频。例如,上传一段西游记孙悟空的语音,用户便可以提取其音频用在别的地方。
文本转语音:用户输入文本,就能生成29种语言、120种不同类型的语音,并且在情感、节奏方面非常好机器感很少。
AI配音:这是ElevenLabs最新推出专门针对电影、长音频领域的产品,可实现端到端的高保真音频。
此外,ElevenLabs还提供了一个语音库,用户可以将自己生成的音频或声音与其他人分享来换取报酬。未来,通过Music生成的音乐,也可以通过该平台进行分享。
目前,ElevenLabs Music处于早期预览版,全面开放测试后「AIGC开放社区」会第一时间告诉大家。
阿里推声画同步框架EMO 1张图片加音频即可生成对口型视频
要点:阿里提出了EMO框架,可根据单张图像和声音生成具有表情丰富的头像视频。方法包括两个主要阶段:帧编码和扩散过程,利用多种注意机制和时间模块实现头像生成。EMO支持多语言歌曲和不同风格的头像生成,可应用于歌唱、对话和跨角色表演等领域。站长网2024-02-28 14:24:460000生成式 AI 安全标准发布,覆盖训练数据和生成内容
划重点:⭐中国发布《生成式AI安全基本要求》,涵盖训练数据、生成内容等⭐标准要求细化了训练数据、生成内容和模型安全要求⭐中国连续出台安全管理条例,展示对创新技术重视,保障人工智能应用安全站长网2024-06-03 09:06:500000比尔·盖茨预测未来人人都将拥有 AI「代理人」:人工智能将在几乎任何活动和生活的任何领域帮助用户
微软联合创始人比尔·盖茨近日对人工智能的未来做出大胆预测,他认为每个人很快都将拥有一个代表他们行动的机器人「代理人」。据《财富》杂志报道,盖茨表示:「在不远的将来,任何在线的人都将能够拥有一个由人工智能驱动的个人助手,其能力将远超今日技术。这些代理人更聪明。它们是主动的——能够在你提出要求之前就提出建议。」站长网2023-11-15 20:43:100002男子高铁吸烟狂言:不差钱随便罚 工作不顺心情郁闷
近日,一则关于男子在高铁上违规吸烟并嚣张叫嚣的新闻引发了广泛关注。据报道,本月26日,在从杭州东开往厦门的G1679次列车上,一名男子公然在车厢连接处吸烟,严重违反了高铁禁烟的规定。0000Meta发布高效SAM模型EffcientSAM 速度提升20倍!
继万物皆可分割的SAM模型后,Meta又发布了更高效的EfficientSAM模型。EfficientSAM是一项创新性的工作,旨在降低SAM模型的计算复杂性,使其在更广泛的实际应用中表现出色。该模型通过引入掩码图像预训练(SAMI)成功降低了SAM模型的计算复杂性,实现了速度提升20倍、参数减少20倍,同时性能仅损失约1.5mIoU。站长网2023-12-08 14:57:160003