Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天?
Cartesia 发布了一个名为 Sonic 的低延迟语音生成模型,该模型以其快速的推理速度和超低的延迟引起了广泛关注。Sonic 的延迟仅为135毫秒,能够生成具有逼真情感和表达能力的语音。用户只需提供10秒的录音,Sonic 即可模仿说话者的韵律、语调和声音特征,并且可以调节音调、速度、情感、发音和速度。

图片截自歸藏
Sonic模型特点:
超低延迟:模型的延迟仅为135毫秒,这意味着它可以实时生成语音,非常适合聊天应用。
情感表达:Sonic能够展现出人类的情感和表达能力,使对话更加自然和富有表现力。
快速模仿:仅需10秒的录音,Sonic就能模仿说话者的韵律、语调和声音特征。
可调节参数:用户可以调节音调、速度、情感、发音等参数,定制化语音输出。
Cartesia 的目标是打造能够在任何设备上长期运行的实时智能系统。为此,他们引入了创新的“状态空间模型”(SSM)架构,用于构建下一代基础模型。SSM 模型能够处理任意大小的语境,并且可以原生地实时处理各种形式的模态。Cartesia 的创始人 Albert 和 Karan 在过去四年中共同开发了 SSM,这是一种更高效的 AI 模型构建方法,能够像人类一样流式传输信息。

在实时对话型 AI 的开发方面,Cartesia 已经取得了初步进展。他们正在研发一个具有长期记忆、能够实时对话的 AI 计算平台,该平台可以解决复杂问题,为用户带来全新的体验。低延迟是构建实时智能的一大挑战,模型需要在接收到输入时立即做出响应。通过新的 SSM 架构,Cartesia 提高了高分辨率模态(如音频和视频)的生成效率和低延迟性能。实验表明,与广泛使用的 Transformer 模型相比,他们的模型在质量、推理速度、吞吐量和延迟方面都有显著改进。
使用 SSM 架构,Cartesia 训练了 Sonic 语音模型,该模型能以135毫秒的延迟生成高质量、逼真的语音。为了实现低延迟和高吞吐量,他们优化了 SSM 推理系统,从而以更低的成本提供高质量的模型。Sonic 已经发布,并提供了一个 Web Playground 和低延迟 API。用户可以在 Playground 中使用多样化的语音库进行应用程序开发,包括客户支持、娱乐和内容创作,还支持即时克隆和语音设计(如调节速度和情感)。用户也可以通过 API 访问这些功能。
Cartesia 的下一个目标是在未来一年内实现原生多模态的实时智能,不仅局限于音频领域。他们希望能够实现对任何形式的模态进行即时理解和生成,进一步推动实时智能的发展。
官网:https://top.aibase.com/tool/carteisa-sonic
试玩地址:https://play.cartesia.ai/
抖音精致妈妈才是真香啊!
各位村民好,我是村长。抖音上的好物带货账号有很多,许多小姑娘、宝妈、老大娘都在做。比如搞开箱的、图文的、宝妈的等等,有些赛道类型过于拥挤,普通人拿起手机就能拍。今天村长要和大家分享好物带货的另一个类型:精致妈妈带货,目前在好物带货领域,还是比较吃香的。01什么是精致妈妈那么有一些人肯定会问了,什么是精致妈妈?网上关于精致妈妈的定义有很多种,甚至还有精致妈妈相关的研究分析报告。站长网2023-05-06 09:03:150000Stability AI发布DreamStudio开源版 命名为StableStudio
日前,StableDiffusion背后的公司StabilityAI宣布推出StableStudio,这是其DreamStudioAI文本到图像网络应用程序的开源版本,展示该公司致力于推进开源开发的决心。StabilityAI的开源方法提高了人们对其产品的兴趣,包括StableDiffusion和StableLM。站长网2023-05-18 10:26:500000百度推出AgentBuilder、AppBuilder、ModelBuilder三大开发工具
在Create2024百度AI开发者大会的主题演讲中,百度创始人、董事长兼首席执行官李彦宏向与会者展示了三大引人注目的开发工具:AgentBuilder、AppBuilder和ModelBuilder。这些工具不仅便于开发者们轻松打包带走,更可即刻投入使用,助力他们在AI领域的创新实践。站长网2024-04-18 21:55:530000英特尔正将AI PC引入汽车领域 极氪为首个搭载新芯片公司
**划重点:**1.🧠Intel发布首款面向汽车领域的AI聚焦芯片,计划提升语音助手和主动安全功能。2.🚙中国吉利旗下的极氪(Zeekr)将成为首家安装这些新芯片的汽车制造商,首款搭载IntelAI硬件的Zeekr车型将于今年年底推出。3.⚙️Intel计划推出一系列用于软件定义汽车的芯片,预计在2024年底首次亮相,以提高汽车内体验。0000“AI脱衣”应用横行 访问量剧增达2400万人次
**划重点:**1.📈2023年9月,使用人工智能将女性照片“脱衣”的应用和网站访问量激增,达到2400万人次。2.🌐这些“脱衣”服务通过社交媒体广告,其中广告链接在社交媒体上的增长超过2400%,引发对非同意深度伪造色情的担忧。3.⚖️随着AI技术进步,深度伪造软件变得更容易且更有效,导致普通人对普通目标进行此类行为,引发隐私和法律问题。00070