MyShell发布开源AI语音克隆工具OpenVoice,瞄准语音模仿领域
**划重点:**
1. 🔍 **开源创新**:MIT、清华大学与加拿大AI初创公司MyShell联手推出开源语音克隆工具OpenVoice,在克隆用户声音方面,采用了概念简单但高效的方法,大幅减少计算资源消耗。
2. 🌐 **功能强大**:OpenVoice提供几乎即时的语音克隆,同时具备其他克隆平台所不具备的细致控制,包括语调、情感、节奏、停顿和语调等多方面的精确调整。
3. 💼 **MyShell商业模式**:MyShell计划通过开源OpenVoice,通过其Web应用提供月度订阅、第三方机器人创建者推广费用以及人工智能培训数据费用等多方面赚取收入。
MyShell最新推出的开源语音克隆工具OpenVoice引起了广泛关注。这一创新产品由麻省理工学院(MIT)、清华大学以及加拿大人工智能初创公司MyShell合作开发。OpenVoice采用了一种概念简单但高效的方法,可几乎即时克隆用户的语音,并使用明显更少的计算资源。
该工具不仅具备语音克隆的基本功能,而且提供了细致入微的控制选项,涵盖语调、情感、节奏、停顿和语调等多个方面。这意味着用户可以通过OpenVoice生成具有个性化风格的语音克隆,而无需花费大量时间和计算资源。
在作者的非科学性测试中,使用OpenVoice在HuggingFace平台上生成了一个相对令人信服的语音克隆,仅需几秒钟的随机语音即可完成。与其他语音克隆应用不同的是,用户无需朗读特定文本片段,只需随意说几秒钟的话,即可立即生成可播放的语音克隆,读取提供的文本提示。
OpenVoice的背后是两个主要的AI模型:文本到语音(TTS)模型和“音调转换器”模型。TTS模型控制“风格参数和语言”,并且通过来自两名英语演讲者(美国和英国口音)、一名中文演讲者和一名日本演讲者的30,000个句子的音频样本进行训练。与此同时,音调转换器模型则通过来自20,000多名不同演讲者的300,000个音频样本进行训练。
通过将用户提供的录音音频的音调与TTS模型的“基础发声者”结合起来,这两个模型共同可以复制用户的语音,并改变其“音调颜色”或文本所表达的情感表达。与其他方法相比,OpenVoice的方法在克隆语音时大大减少了计算资源的使用,包括Meta的竞争对手Voicebox。
MyShell,作为OpenVoice的推动者,成立于2023年,总部位于加拿大艾伯塔省的卡尔加里,通过由INCE Capital主导的560万美元种子轮融资以及Folius Ventures、Hashkey Capital、SevenX Ventures、TSVC和OP Crypto的额外投资,已经吸引了超过400,000名用户。该初创公司通过其Web应用提供各种基于文本的AI角色和机器人,包括一些带有不同“个性”的角色,还提供动态GIF制作工具和用户生成的基于文本的角色扮演游戏。
尽管MyShell将OpenVoice开源,但该公司仍通过其Web应用的月度订阅、希望在应用程序内推广其产品的第三方机器人创建者费用以及人工智能培训数据费用等多方面赚取收入。这种商业模式旨在为MyShell提供可持续的经济基础,从而在开源和商业利益之间找到平衡。
项目体验网址:https://top.aibase.com/tool/openvoice
论文网址: https://arxiv.org/abs/2312.01479
苹果AI哪去了?前员工揭秘Siri何以走向没落:团队内耗、技术判断太谨慎
苹果为何会在最新一轮ChatGPT趋势中“静悄悄”?答案更进一步浮出水面。内部团队混乱、决策缓慢、代码笨重,都成为了拖累苹果AI更快前进的原因。最直接的体现,可以来看Siri。这大概是大部分普通人认识AI助手的入口,是iPhone鼎盛时期推出的王炸功能;许多人理解ChatGPT时,也不免拿它来做参照。但在比对后就会发现,如今的Siri在智能化上,完全无法和ChatGPT相提并论。站长网2023-05-12 20:40:360002腾讯文档AI智能助手开启公测 支持多项文档类型一键生成能力
腾讯文档智能助手开启公测,全面应用于Word、Excel、PPT、PDF、智能文档、收集表、思维导图等文档类型。此次公测腾讯文档AI能力带来全新升级,涵盖了文本内容秒级处理、函数公式运算应用、表格数据精准呈现、PPT快速生成美化、收集结果自动分析、思维导图一键生成等多项能力,并支持跨品类文档内容畅通流转。站长网2024-01-26 17:08:160000阿里魔搭社区开源知识检索模型Ziya-Reader
阿里魔搭社区宣布开源Ziya-Reader。Ziya-Reader是一个针对知识检索的开源模型。当前大模型在处理多文档任务时,如果正确答案不在第一个或末尾的文档中,准确率会急剧下降。为了解决这个问题,Ziya-Reader应运而生,它可以从多个候选中找到正确的答案。站长网2023-10-16 11:09:310000GoLinks发布企业人工智能搜索引擎GoSearch 支持多模态搜索
**划重点:**1.🚀**GoSearch发布**:GoLinks推出人工智能搜索引擎GoSearch,旨在提高企业工作效率,智能索引并快速检索跨多个平台的相关信息。2.🧠**AI核心技术**:GoSearch利用人工智能作为服务的核心组成部分,具备传统搜索引擎查找文档的功能,同时能够理解用户意图,提供信息摘要,减轻员工的认知负担。站长网2023-12-14 10:49:330000360发布AI数字人广场 可提供超200个角色
360公司正式发布旗下的AI新产品——“360AI数字人广场”。该产品拥有超过200个虚拟数字人角色,例如孙悟空、诸葛亮等数字名人,以及拥有不同职能的数字员工。用户可以根据需求选择不同的虚拟角色,进行对话获取相应的回答和建议。周鸿祎表示,360AI数字人的下一步演进将包括:生成声音、视频,拥有长期记忆,拥有目标分解和规划能力,拥有“手和脚”,具备执行力。站长网2023-06-13 22:27:210000