MyShell发布开源AI语音克隆工具OpenVoice,瞄准语音模仿领域
**划重点:**
1. 🔍 **开源创新**:MIT、清华大学与加拿大AI初创公司MyShell联手推出开源语音克隆工具OpenVoice,在克隆用户声音方面,采用了概念简单但高效的方法,大幅减少计算资源消耗。
2. 🌐 **功能强大**:OpenVoice提供几乎即时的语音克隆,同时具备其他克隆平台所不具备的细致控制,包括语调、情感、节奏、停顿和语调等多方面的精确调整。
3. 💼 **MyShell商业模式**:MyShell计划通过开源OpenVoice,通过其Web应用提供月度订阅、第三方机器人创建者推广费用以及人工智能培训数据费用等多方面赚取收入。
MyShell最新推出的开源语音克隆工具OpenVoice引起了广泛关注。这一创新产品由麻省理工学院(MIT)、清华大学以及加拿大人工智能初创公司MyShell合作开发。OpenVoice采用了一种概念简单但高效的方法,可几乎即时克隆用户的语音,并使用明显更少的计算资源。

该工具不仅具备语音克隆的基本功能,而且提供了细致入微的控制选项,涵盖语调、情感、节奏、停顿和语调等多个方面。这意味着用户可以通过OpenVoice生成具有个性化风格的语音克隆,而无需花费大量时间和计算资源。
在作者的非科学性测试中,使用OpenVoice在HuggingFace平台上生成了一个相对令人信服的语音克隆,仅需几秒钟的随机语音即可完成。与其他语音克隆应用不同的是,用户无需朗读特定文本片段,只需随意说几秒钟的话,即可立即生成可播放的语音克隆,读取提供的文本提示。
OpenVoice的背后是两个主要的AI模型:文本到语音(TTS)模型和“音调转换器”模型。TTS模型控制“风格参数和语言”,并且通过来自两名英语演讲者(美国和英国口音)、一名中文演讲者和一名日本演讲者的30,000个句子的音频样本进行训练。与此同时,音调转换器模型则通过来自20,000多名不同演讲者的300,000个音频样本进行训练。

通过将用户提供的录音音频的音调与TTS模型的“基础发声者”结合起来,这两个模型共同可以复制用户的语音,并改变其“音调颜色”或文本所表达的情感表达。与其他方法相比,OpenVoice的方法在克隆语音时大大减少了计算资源的使用,包括Meta的竞争对手Voicebox。
MyShell,作为OpenVoice的推动者,成立于2023年,总部位于加拿大艾伯塔省的卡尔加里,通过由INCE Capital主导的560万美元种子轮融资以及Folius Ventures、Hashkey Capital、SevenX Ventures、TSVC和OP Crypto的额外投资,已经吸引了超过400,000名用户。该初创公司通过其Web应用提供各种基于文本的AI角色和机器人,包括一些带有不同“个性”的角色,还提供动态GIF制作工具和用户生成的基于文本的角色扮演游戏。
尽管MyShell将OpenVoice开源,但该公司仍通过其Web应用的月度订阅、希望在应用程序内推广其产品的第三方机器人创建者费用以及人工智能培训数据费用等多方面赚取收入。这种商业模式旨在为MyShell提供可持续的经济基础,从而在开源和商业利益之间找到平衡。
项目体验网址:https://top.aibase.com/tool/openvoice
论文网址: https://arxiv.org/abs/2312.01479
机器人Ameca已经具备视觉能力 类人反应令人惊叹
要点:Ameca是一款拥有视觉能力的类人机器人,具备多模态AI功能,展现了接近人类的情感和反应。Ameca的进化涉及多领域技术,包括语言模型、图像生成、语音识别等,使其在交互和创作方面都有显著提升。Ameca的人性化特质来源于广泛的传感器系统和底层操作系统的支持,使其能够精准模拟人类行为和情感反应。0001AI视野:Stable Diffusion3发布;剪映海外版CapCut推文生视频;微软win10、win11照片应用增加AI橡皮擦功能;OpenAI更新GPT商店
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用StableDiffusion3发布文字渲染能力超强,图像生成质量超越Midjourney【AiBase提要:】站长网2024-02-23 15:43:310001困在凑单里的电商卖家
这个双十一,天猫、京东等电商平台都取得不错的成绩。天猫公布,双十一全周期589个品牌成交额破亿,同比去年增长46.5%,刷新历史纪录。京东公布,双十一购物用户数同比增长超20%,超过1.7万个品牌成交额同比增长超五倍,超3万个中小商家成交额同比增长超两倍。不过,并不是所有商家都摸到了一把好牌。不少商家本以为自己在双十一火了,结果是“天塌了”。0000报告发现,许多人工智能治理工具存在“错误修复”
划重点:🚨世界隐私论坛报告指出,超过三分之一的人工智能(AI)治理工具存在“缺陷修复”,对AI系统的公正性和可解释性评估存在问题。🤔一些由微软、IBM和谷歌等公司开发或传播的工具和技术也被发现存在问题,引发关注。🌐尽管存在缺陷,专家表示2024年有望通过国际组织和标准制定机构的合作取得人工智能治理工具的实质性改善。0000三星Galaxy S24系列中国新品发布会今晚举行 国行价格即将公布
今晚(1月25日)19:00,三星将在中国举行GalaxyS24系列新品发布会,正式公布新机的国行价格。此前,三星已在海外发布了GalaxyS24系列手机,而国行的先行者价格也已经公布。GalaxyS24系列包括GalaxyS24、GalaxyS24和GalaxyS24Ultra三款机型。站长网2024-01-25 17:14:180000