Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天?
Cartesia 发布了一个名为 Sonic 的低延迟语音生成模型,该模型以其快速的推理速度和超低的延迟引起了广泛关注。Sonic 的延迟仅为135毫秒,能够生成具有逼真情感和表达能力的语音。用户只需提供10秒的录音,Sonic 即可模仿说话者的韵律、语调和声音特征,并且可以调节音调、速度、情感、发音和速度。
图片截自歸藏
Sonic模型特点:
超低延迟:模型的延迟仅为135毫秒,这意味着它可以实时生成语音,非常适合聊天应用。
情感表达:Sonic能够展现出人类的情感和表达能力,使对话更加自然和富有表现力。
快速模仿:仅需10秒的录音,Sonic就能模仿说话者的韵律、语调和声音特征。
可调节参数:用户可以调节音调、速度、情感、发音等参数,定制化语音输出。
Cartesia 的目标是打造能够在任何设备上长期运行的实时智能系统。为此,他们引入了创新的“状态空间模型”(SSM)架构,用于构建下一代基础模型。SSM 模型能够处理任意大小的语境,并且可以原生地实时处理各种形式的模态。Cartesia 的创始人 Albert 和 Karan 在过去四年中共同开发了 SSM,这是一种更高效的 AI 模型构建方法,能够像人类一样流式传输信息。
在实时对话型 AI 的开发方面,Cartesia 已经取得了初步进展。他们正在研发一个具有长期记忆、能够实时对话的 AI 计算平台,该平台可以解决复杂问题,为用户带来全新的体验。低延迟是构建实时智能的一大挑战,模型需要在接收到输入时立即做出响应。通过新的 SSM 架构,Cartesia 提高了高分辨率模态(如音频和视频)的生成效率和低延迟性能。实验表明,与广泛使用的 Transformer 模型相比,他们的模型在质量、推理速度、吞吐量和延迟方面都有显著改进。
使用 SSM 架构,Cartesia 训练了 Sonic 语音模型,该模型能以135毫秒的延迟生成高质量、逼真的语音。为了实现低延迟和高吞吐量,他们优化了 SSM 推理系统,从而以更低的成本提供高质量的模型。Sonic 已经发布,并提供了一个 Web Playground 和低延迟 API。用户可以在 Playground 中使用多样化的语音库进行应用程序开发,包括客户支持、娱乐和内容创作,还支持即时克隆和语音设计(如调节速度和情感)。用户也可以通过 API 访问这些功能。
Cartesia 的下一个目标是在未来一年内实现原生多模态的实时智能,不仅局限于音频领域。他们希望能够实现对任何形式的模态进行即时理解和生成,进一步推动实时智能的发展。
官网:https://top.aibase.com/tool/carteisa-sonic
试玩地址:https://play.cartesia.ai/
大佬们争论AI监管:吴恩达力挺开放,LeCun警告垄断
要点:1.吴恩达、LeCun等AI大佬就AI监管问题展开激烈辩论,吴恩达支持开放性监管,认为不合格的监管不如不监管。2.争议主要围绕AI可能危及人类未来和对AI技术的严格监管展开,引发了口水战。3.美国政府发布了人工智能技术行政命令,但缺乏具体保护失业或收入减少的工人,引发担忧。在一场关于AI监管的激烈辩论中,吴恩达、LeCun等知名AI专家就监管问题发表不同意见。站长网2023-10-31 16:16:290000谷歌Pixel Buds Pro耳机发布:支持蓝牙超宽带技术、31小时续航
快科技10月5日消息,谷歌发布了新款PixelBudsPro耳机,售价为199.99元(约合人民币1460元)。外形方面,新款耳机采用胶囊设计,拥有海岸蓝、瓷器白、珊瑚红、炭黑、雾蓝、柠檬草黄六种配色,并且保留了谷歌的G”标志。同时,PixelBudsPro耳机依然保留了减压通风孔设计,除了缓解耳朵的压力,可还帮助用户避免在长时间使用时出现眩晕现象。站长网2023-10-05 09:14:580000Worldcoin表示将允许公司和政府使用其身份验证系统
本文概要:1.Worldcoin计划扩大其业务,吸引更多用户,并允许其他组织使用其虹膜扫描和身份验证技术。2.公司表示已有220万人注册,大部分是在过去两年的试用期内注册的。3.数据监管机构正在调查该项目,对于数据收集和隐私保护存在担忧。站长网2023-08-03 16:04:180000英伟达和 AI 改变芯片行业的格局,竞争对手现在必须奋起直追
随着2023年人工智能技术的迅猛发展,半导体行业格局发生了翻天覆地的变化。Nvidia(英伟达)凭借其在数据中心图形处理器(GPU)市场的领先地位,首次超越了长期占据美国芯片制造商榜首位置的Intel。0000老外的尴尬和狼狈里,藏着中国入境游的商机
6月末的一个工作日,北京城正在低气压中忍耐暴雨来临前最后的酷热。中午11点,王府井大街的阳光下几乎看不到什么行人,强烈的光线把游客赶进路两侧的冷饮或特产店,偶尔,会有结伴的外国游客成群出现。最近几月,中国一二线城市的外国游客浓度明显升高了。他们很好辨认:穿紧身速干运动装或吊带背心,很少穿防晒衣,最多戴黑色遮阳镜,不怕晒,喜欢走在大路中央,东张西望。站长网2024-07-06 16:15:010000