Deepgram推创新文本转语音模型Aura 支持实时文本转语音
要点:
Deepgram推出Aura,一款创新的文本转语音模型,提供比所有语音AI替代品更快速、更高效的人类般对话质量。
Aura致力于为实时语音AI代理提供真实的声音,包括及时的回应、在思考时使用自然的语音填充词汇(如“嗯”和“啊”),以及根据对话背景调节语调和情感。
Deepgram期望通过Aura成为实时、对话式语音AI代理的完整平台,为开发者提供构建未来高吞吐量、实时AI代理所需的基本构件。
深瞳公司推出了一款名为Aura的全新文本转语音模型,旨在满足实时语音AI代理的需求。随着大型语言模型(LLMs)的普及,语音交互成为访问LLMs及其解锁体验的主要手段。Aura的推出旨在解决当前语音AI供应商存在的速度、成本、可靠性和对话质量等方面的问题。相较于当前市场上的主流替代品,Aura在早期版本的盲评试中被评为更贴近人类声音,其开发计划也得到了提前扩展。
官方地址:https://deepgram.com/learn/aura-text-to-speech-api-waitlist
针对语音AI技术的不同应用,Deepgram区分了两个主要领域:高产出和高吞吐量。高产出关注打造完美声音,用于视频游戏或有声读物等项目,强调声音质量。而高吞吐量则着眼于实时对话,如快餐订餐、预约和了解汽车经销商的最新优惠等任务,注重对话流畅性和效率。Deepgram的目标是通过Aura在高吞吐量领域提供高效的文本转语音转换,以实现用户体验的平滑和可靠。
Aura的独特之处在于赋予AI代理更具人类特征的声音,包括及时的回应、在思考时使用自然的语音填充词汇,以及根据对话背景调整语调和情感。早期版本的Aura在盲评试中被评为比其他替代品更贴近人类声音,甚至在某些音频片段中超过了人类演讲者。
多年来,Deepgram一直致力于推动语音识别和口头语言理解技术的可能性。他们的团队不仅发展了能处理对话音频细微差异的新型转换器架构,还在处理各种语言、口音和方言的同时处理了口语中的不流畅和对话中的变化。通过有限约束构建模型,以优化其速度和效率。Deepgram还拥有内部数据标注和数据运营团队,通过构建定制工作流,记录、存储和传输大量音频,并持续扩充其高质量数据库,用于模型训练。
Aura被设计为速度、质量和效率的全能解决方案,旨在成为高质量选项中最快速、快速选项中最高质量的文本转语音模型。Deepgram强调,Aura的发布仅是一个开始,他们期待在与客户和合作伙伴的合作中继续完善和扩展该模型,共同定义AI代理的未来。计划于明年初正式发布,而开发者可以通过加入Aura的等待列表来获取早期体验并提供直接反馈。
Salesforce调查:68%的员工支持生成式AI,以帮助改善工作
Salesforce的一项新调查发现,68%的员工表示,生成式人工智能将帮助他们更好地为客户服务。Salesforce的GenerativeAISnapshotResearch调查了4000多名全职员工。研究发现,73%的员工认为生成式人工智能会带来新的安全风险,尽管大多数人使用或计划使用该技术。站长网2023-06-22 12:28:040001百度发布小度学习机K16:搭载文心大模型 售价2299元
百度旗下人工智能语音助手小度正式发布小度学习机K16,K16是一款全面升级的学习机器人产品。目前,小度学习机K16已经在小度商城及各大电商平台开启预售,售价2299元。它具有以下几个方面的升级:站长网2024-01-09 09:08:11000116万抖音网友围观AI谈恋爱 ChatGPT语音功能被网友玩坏了
ChatGPT语音功能被网友玩坏了!最近,抖音博主“新竹AI”让两个手机上的ChatGPT互相亲密交流,这场AI之间的恋爱对话被超16万网友围观。这段对话开始于男生AI的邀请,他提议一次浪漫的约会,包括前往酒吧放松、海边漫步欣赏海浪声音,以及在有情调的餐厅享受晚餐。他表达了愿意满足女生AI的喜好的决心。站长网2023-10-31 14:22:300000不拍视频不直播,揭秘抖音图文男装玩法
各位村民好,我是村长。都说男性消费欲望低,可支配收入少,给男生卖产品挺难。虽然这是一定的事实,但并不代表男性真的没有消费需求、没有购买力。只是相对女性而言,男性的消费需求毕竟单一和低频而已。今天我要和大家分享一个在抖音卖男装的案例,不拍视频、不做直播,也能把产品卖出去。01抖音图文男装这个账号是在抖音上卖男装的,内容形式不是视频和直播,而是图文。站长网2023-07-20 13:42:000000王小川的大模型打造秘籍首次曝光:五步走,两个月炼成
王小川两个月交卷的大模型,是怎么炼成的?现在,这个问题有了更为详细的解。70亿参数、一经发布就开源可商用,百川智能的中英文大模型baichuan-7B,近期在圈内备受瞩目。从公开的benchmark测试效果以及社区的使用反馈来看,baichuan-7B的表现非常优秀,据说清北也已经用上了。其源代码也已在Github、Huggingface等平台发布。站长网2023-07-05 20:58:030001