Deepgram推创新文本转语音模型Aura 支持实时文本转语音
要点:
Deepgram推出Aura,一款创新的文本转语音模型,提供比所有语音AI替代品更快速、更高效的人类般对话质量。
Aura致力于为实时语音AI代理提供真实的声音,包括及时的回应、在思考时使用自然的语音填充词汇(如“嗯”和“啊”),以及根据对话背景调节语调和情感。
Deepgram期望通过Aura成为实时、对话式语音AI代理的完整平台,为开发者提供构建未来高吞吐量、实时AI代理所需的基本构件。
深瞳公司推出了一款名为Aura的全新文本转语音模型,旨在满足实时语音AI代理的需求。随着大型语言模型(LLMs)的普及,语音交互成为访问LLMs及其解锁体验的主要手段。Aura的推出旨在解决当前语音AI供应商存在的速度、成本、可靠性和对话质量等方面的问题。相较于当前市场上的主流替代品,Aura在早期版本的盲评试中被评为更贴近人类声音,其开发计划也得到了提前扩展。

官方地址:https://deepgram.com/learn/aura-text-to-speech-api-waitlist
针对语音AI技术的不同应用,Deepgram区分了两个主要领域:高产出和高吞吐量。高产出关注打造完美声音,用于视频游戏或有声读物等项目,强调声音质量。而高吞吐量则着眼于实时对话,如快餐订餐、预约和了解汽车经销商的最新优惠等任务,注重对话流畅性和效率。Deepgram的目标是通过Aura在高吞吐量领域提供高效的文本转语音转换,以实现用户体验的平滑和可靠。
Aura的独特之处在于赋予AI代理更具人类特征的声音,包括及时的回应、在思考时使用自然的语音填充词汇,以及根据对话背景调整语调和情感。早期版本的Aura在盲评试中被评为比其他替代品更贴近人类声音,甚至在某些音频片段中超过了人类演讲者。
多年来,Deepgram一直致力于推动语音识别和口头语言理解技术的可能性。他们的团队不仅发展了能处理对话音频细微差异的新型转换器架构,还在处理各种语言、口音和方言的同时处理了口语中的不流畅和对话中的变化。通过有限约束构建模型,以优化其速度和效率。Deepgram还拥有内部数据标注和数据运营团队,通过构建定制工作流,记录、存储和传输大量音频,并持续扩充其高质量数据库,用于模型训练。
Aura被设计为速度、质量和效率的全能解决方案,旨在成为高质量选项中最快速、快速选项中最高质量的文本转语音模型。Deepgram强调,Aura的发布仅是一个开始,他们期待在与客户和合作伙伴的合作中继续完善和扩展该模型,共同定义AI代理的未来。计划于明年初正式发布,而开发者可以通过加入Aura的等待列表来获取早期体验并提供直接反馈。
华为服务爱心驿站来了!所有户外工作者可免费休息、饮水、充电
快科技7月21日消息,近期全国多地高温,据华为终端客户服务官方介绍,2024年7月22日至8月31日华为服务爱心驿站将为户外工作者免费服务。所有户外工作者可以免费纳凉休憩,店内免费提供Wi-Fi、饮水等服务消暑降温,恢复体力,预防中暑。同时还提供免费充电服务,可提供100W有线超级快充,如果户外工作者的手机支持,可以迅速回血。站长网2024-07-21 14:12:050000GPT-4在医学问题上击败了专业调优的 MedPaLM 2 模型
在研究中,微软的研究人员展示了GPT-4在医学知识测试中的卓越表现,特别是当结合先进的提示工程技术时,其性能超过了专业调整的MedPaLM2。研究结果显示,相较于费时费力的调优和模型训练,将更有效的提示工程应用于主流通用模型可能是实现更准确结果的更好途径。站长网2023-12-04 11:17:220000京东许冉:研发投入累计超1000亿 大模型将应用于多个场景
在2023年世界互联网大会乌镇峰会上,京东集团首席执行官许冉在互联网企业家论坛上发表演讲,阐述了京东以供应链为基础的新型实体企业的发展理念。她强调了数字技术与实体经济深度融合对于创新的重要推动作用,并介绍了京东在技术创新方面的成果和经验。站长网2023-11-09 10:41:250000小米推出PC换机助手 最高速率90MB/s
站长之家(ChinaZ.com)2月21日消息:近日,小米正式推出了PC换机助手,这款工具旨在为用户提供一个便捷、高效的数据迁移方案。据悉,小米PC换机助手不仅支持多种旧机型号的数据迁移至小米新PC,而且迁移过程只需一键操作,极大简化了用户的操作步骤。更令人惊喜的是,该工具的最高平均传输速率可达每秒90MB,迁移速度之快令人咋舌。站长网2024-02-21 16:58:000000Ollama支持多模态模型使用
Ollama最新版本支持多模态模型使用了,只需输入“ollamarunllava”并运行即可。在下载llava-7B模型后,只需拖放图像输入问题即可。Ollama是一款命令行工具,可以在macOS和Linux上本地运行Llama2、CodeLlama和其他模型。目前适用于macOS和Linux,并计划支持Windows。站长网2023-12-14 17:22:4800020