MyShell发布开源AI语音克隆工具OpenVoice,瞄准语音模仿领域
**划重点:**
1. 🔍 **开源创新**:MIT、清华大学与加拿大AI初创公司MyShell联手推出开源语音克隆工具OpenVoice,在克隆用户声音方面,采用了概念简单但高效的方法,大幅减少计算资源消耗。
2. 🌐 **功能强大**:OpenVoice提供几乎即时的语音克隆,同时具备其他克隆平台所不具备的细致控制,包括语调、情感、节奏、停顿和语调等多方面的精确调整。
3. 💼 **MyShell商业模式**:MyShell计划通过开源OpenVoice,通过其Web应用提供月度订阅、第三方机器人创建者推广费用以及人工智能培训数据费用等多方面赚取收入。
MyShell最新推出的开源语音克隆工具OpenVoice引起了广泛关注。这一创新产品由麻省理工学院(MIT)、清华大学以及加拿大人工智能初创公司MyShell合作开发。OpenVoice采用了一种概念简单但高效的方法,可几乎即时克隆用户的语音,并使用明显更少的计算资源。

该工具不仅具备语音克隆的基本功能,而且提供了细致入微的控制选项,涵盖语调、情感、节奏、停顿和语调等多个方面。这意味着用户可以通过OpenVoice生成具有个性化风格的语音克隆,而无需花费大量时间和计算资源。
在作者的非科学性测试中,使用OpenVoice在HuggingFace平台上生成了一个相对令人信服的语音克隆,仅需几秒钟的随机语音即可完成。与其他语音克隆应用不同的是,用户无需朗读特定文本片段,只需随意说几秒钟的话,即可立即生成可播放的语音克隆,读取提供的文本提示。
OpenVoice的背后是两个主要的AI模型:文本到语音(TTS)模型和“音调转换器”模型。TTS模型控制“风格参数和语言”,并且通过来自两名英语演讲者(美国和英国口音)、一名中文演讲者和一名日本演讲者的30,000个句子的音频样本进行训练。与此同时,音调转换器模型则通过来自20,000多名不同演讲者的300,000个音频样本进行训练。

通过将用户提供的录音音频的音调与TTS模型的“基础发声者”结合起来,这两个模型共同可以复制用户的语音,并改变其“音调颜色”或文本所表达的情感表达。与其他方法相比,OpenVoice的方法在克隆语音时大大减少了计算资源的使用,包括Meta的竞争对手Voicebox。
MyShell,作为OpenVoice的推动者,成立于2023年,总部位于加拿大艾伯塔省的卡尔加里,通过由INCE Capital主导的560万美元种子轮融资以及Folius Ventures、Hashkey Capital、SevenX Ventures、TSVC和OP Crypto的额外投资,已经吸引了超过400,000名用户。该初创公司通过其Web应用提供各种基于文本的AI角色和机器人,包括一些带有不同“个性”的角色,还提供动态GIF制作工具和用户生成的基于文本的角色扮演游戏。
尽管MyShell将OpenVoice开源,但该公司仍通过其Web应用的月度订阅、希望在应用程序内推广其产品的第三方机器人创建者费用以及人工智能培训数据费用等多方面赚取收入。这种商业模式旨在为MyShell提供可持续的经济基础,从而在开源和商业利益之间找到平衡。
项目体验网址:https://top.aibase.com/tool/openvoice
论文网址: https://arxiv.org/abs/2312.01479
OpenAI的12份圣诞礼物,透露出AI公司领头羊的困境
AI界最会营销的公司OpenAI,总算放完了所有的圣诞礼物。从12月4日开始,OpenAI进行了为期12天的发布活动,每个工作日都有新的产品发布或功能演示。一开始听到这个消息,大家都很兴奋,猜测AGI难道真的要来了?虽然OpenAI的发布时间正好是北京时间的凌晨2点,但还是有不少AI媒体和玩家熬夜蹲守直播。站长网2024-12-23 17:02:580000《纽约时报》起诉微软和 ChatGPT 开发商 OpenAI,指控侵犯版权并滥用其知识产权
纽约时报于当地时间周三对微软和流行的人工智能聊天机器人ChatGPT的开发者OpenAI提起诉讼,指控这些公司侵犯版权,并滥用报纸的知识产权来训练大型语言模型。微软既是OpenAI的投资者,也是其供应商,为其提供Azure云计算技术的访问。0000曝小米15 Ultra春节后登场:2亿像素潜望长焦无敌
快科技10月14日消息,博主数码闲聊站暗示,小米15Ultra升级为2亿像素超大底潜望长焦,进光量遥遥领先竞品。据爆料,小米15系列中Pro版和Ultra版都配备了潜望镜头,其中Ultra版独占2亿像素潜望,型号是三星ISOCELLHP9,焦距是100mm,支持光学防抖。0000人工智能人才竞争升温 OpenAI允许部分员工将所持股份套现
据TheInformation消息,一位直接了解情况的人士说,OpenAI已经告诉员工,它已经完成了一项收购要约,允许一些员工将其持有的股份套现。此举为去年秋天开始的一个过程画上了句号,同时也为从微软筹集数十亿美元的谈判画上了句号。站长网2023-04-18 15:47:050000滴滴全面“崩溃”12小时 预计损失千万订单和4亿成交额
11月27日晚间,滴滴因系统故障导致App服务异常。滴滴出行包括网约车、共享单车等所有业务全面瘫痪,直到次日凌晨方才基本恢复。此次故障达12小时之久,是滴滴近年来持续时间最长的一次大规模故障。站长网2023-11-28 16:41:070000