注册

首页站长资讯Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天？

23087

Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天？

站长网2024-05-31 19:13:090阅

Cartesia 发布了一个名为 Sonic 的低延迟语音生成模型，该模型以其快速的推理速度和超低的延迟引起了广泛关注。Sonic 的延迟仅为135毫秒，能够生成具有逼真情感和表达能力的语音。用户只需提供10秒的录音，Sonic 即可模仿说话者的韵律、语调和声音特征，并且可以调节音调、速度、情感、发音和速度。

图片截自歸藏

Sonic模型特点:

超低延迟:模型的延迟仅为135毫秒，这意味着它可以实时生成语音，非常适合聊天应用。

情感表达:Sonic能够展现出人类的情感和表达能力，使对话更加自然和富有表现力。

快速模仿:仅需10秒的录音，Sonic就能模仿说话者的韵律、语调和声音特征。

可调节参数:用户可以调节音调、速度、情感、发音等参数，定制化语音输出。

Cartesia 的目标是打造能够在任何设备上长期运行的实时智能系统。为此，他们引入了创新的“状态空间模型”（SSM）架构，用于构建下一代基础模型。SSM 模型能够处理任意大小的语境，并且可以原生地实时处理各种形式的模态。Cartesia 的创始人 Albert 和 Karan 在过去四年中共同开发了 SSM，这是一种更高效的 AI 模型构建方法，能够像人类一样流式传输信息。

在实时对话型 AI 的开发方面，Cartesia 已经取得了初步进展。他们正在研发一个具有长期记忆、能够实时对话的 AI 计算平台，该平台可以解决复杂问题，为用户带来全新的体验。低延迟是构建实时智能的一大挑战，模型需要在接收到输入时立即做出响应。通过新的 SSM 架构，Cartesia 提高了高分辨率模态（如音频和视频）的生成效率和低延迟性能。实验表明，与广泛使用的 Transformer 模型相比，他们的模型在质量、推理速度、吞吐量和延迟方面都有显著改进。

使用 SSM 架构，Cartesia 训练了 Sonic 语音模型，该模型能以135毫秒的延迟生成高质量、逼真的语音。为了实现低延迟和高吞吐量，他们优化了 SSM 推理系统，从而以更低的成本提供高质量的模型。Sonic 已经发布，并提供了一个 Web Playground 和低延迟 API。用户可以在 Playground 中使用多样化的语音库进行应用程序开发，包括客户支持、娱乐和内容创作，还支持即时克隆和语音设计（如调节速度和情感）。用户也可以通过 API 访问这些功能。

Cartesia 的下一个目标是在未来一年内实现原生多模态的实时智能，不仅局限于音频领域。他们希望能够实现对任何形式的模态进行即时理解和生成，进一步推动实时智能的发展。

官网：https://top.aibase.com/tool/carteisa-sonic

试玩地址：https://play.cartesia.ai/

Cartesia发布低延迟语音生成模型Sonic要复刻ChatGPT实时语音聊天

0000

评论列表

共(0)条

相关推荐

站长资讯
抖音精致妈妈才是真香啊！
各位村民好，我是村长。抖音上的好物带货账号有很多，许多小姑娘、宝妈、老大娘都在做。比如搞开箱的、图文的、宝妈的等等，有些赛道类型过于拥挤，普通人拿起手机就能拍。今天村长要和大家分享好物带货的另一个类型:精致妈妈带货，目前在好物带货领域，还是比较吃香的。01什么是精致妈妈那么有一些人肯定会问了，什么是精致妈妈?网上关于精致妈妈的定义有很多种，甚至还有精致妈妈相关的研究分析报告。
站长网2023-05-06 09:03:15
0000
站长资讯
Stability AI发布DreamStudio开源版命名为StableStudio
日前，StableDiffusion背后的公司StabilityAI宣布推出StableStudio，这是其DreamStudioAI文本到图像网络应用程序的开源版本，展示该公司致力于推进开源开发的决心。StabilityAI的开源方法提高了人们对其产品的兴趣，包括StableDiffusion和StableLM。
站长网2023-05-18 10:26:50
0000
站长资讯
百度推出AgentBuilder、AppBuilder、ModelBuilder三大开发工具
在Create2024百度AI开发者大会的主题演讲中，百度创始人、董事长兼首席执行官李彦宏向与会者展示了三大引人注目的开发工具:AgentBuilder、AppBuilder和ModelBuilder。这些工具不仅便于开发者们轻松打包带走，更可即刻投入使用，助力他们在AI领域的创新实践。
站长网2024-04-18 21:55:53
0000
英特尔正将AI PC引入汽车领域极氪为首个搭载新芯片公司
**划重点:**1.🧠Intel发布首款面向汽车领域的AI聚焦芯片，计划提升语音助手和主动安全功能。2.🚙中国吉利旗下的极氪（Zeekr）将成为首家安装这些新芯片的汽车制造商，首款搭载IntelAI硬件的Zeekr车型将于今年年底推出。3.⚙️Intel计划推出一系列用于软件定义汽车的芯片，预计在2024年底首次亮相，以提高汽车内体验。
站长网站长资讯2024-01-10 10:50:34
0000
“AI脱衣”应用横行访问量剧增达2400万人次
**划重点:**1.📈2023年9月，使用人工智能将女性照片“脱衣”的应用和网站访问量激增，达到2400万人次。2.🌐这些“脱衣”服务通过社交媒体广告，其中广告链接在社交媒体上的增长超过2400%，引发对非同意深度伪造色情的担忧。3.⚖️随着AI技术进步，深度伪造软件变得更容易且更有效，导致普通人对普通目标进行此类行为，引发隐私和法律问题。
站长网站长资讯2023-12-08 16:07:36
00070

热点

《封神2》崩的越惨，DeepSeek的刀就越锋利。
2025-02-06 18:40:06
iPhone用户警惕！苹果App Store首次发现OCR恶意软件：悄无声息窃取资料
2025-02-07 03:21:16
一周打赏20万，各个品牌为做“榜一大哥”正在疯狂撒钱。
2025-02-06 18:38:10
模型优惠进入倒计时 DeepSeek因服务器暂停API服务充值
2025-02-07 03:18:38
过年三件套平替爆火：商家月入200万，订单“根本发不完”
2025-02-06 01:10:59
小米眼镜官微上线：智能眼镜赛道要爆发
2025-02-07 02:59:11
一个行业的AI样板：教培的不同环节怎么被改写
2025-02-05 23:37:52
这个春节大家都在看什么？哪吒创影史纪录，DeepSeek刷屏全网
2025-02-07 02:48:00
黄仁勋喊话年轻人：学会用AI 才能更出色
2025-02-05 23:36:32
告别5美元包邮，Temu和Shein还是比亚马逊便宜
2025-02-07 02:47:51

关注

小鹏G9/G6正式登陆爱尔兰/芬兰：加速欧洲市场布局
2025-02-04 09:36:20
《哪吒2》登顶，谁赚麻了？
2025-02-07 15:41:39
小米汽车门店已有216家门店：覆盖全国64城
2025-02-04 09:33:18
雷军去小米汽车工厂上班了：确认要进一步提产冲击年销30万辆
2025-02-07 15:06:26
三星Exynos 2500芯片确认于2025年下半年推出：性能不及骁龙8 Elite
2025-02-04 07:34:04
小米眼镜官博上线旗下首款AI眼镜将发布
2025-02-07 10:20:34
DeepSeek创始人老家成热门打卡地：家长带着孩子拍照打卡
2025-02-04 07:31:46
模型优惠进入倒计时 DeepSeek因服务器暂停API服务充值
2025-02-07 03:18:38
硅谷掀桌！DeepSeek遭OpenAI和Anthropic围剿，美国网友都看不下去了
2025-02-02 16:49:29
小米眼镜官微上线：智能眼镜赛道要爆发
2025-02-07 02:59:11

推荐