仅两秒延迟!新一代AI语言翻译系统Seamless发布,实现跨语言交流新突破
划重点:
🗣️ 实时表达:Seamless首次公开发布,通过SeamlessExpressive和SeamlessStreaming模型,实现语音到语音翻译中的表达保留和低延迟流式处理。
🌍 多语言支持:SeamlessM4T v2基础上构建,覆盖英语、西班牙语、德语、法语、意大利语和中文等语言,实现真实感情和风格的跨语言传递。
🔄 数据工具公开:发布metadata、数据对齐工具,扩展SeamlessAlign语料库,助力研究社区收集更多翻译数据。
在我们日益互联的世界中,语言差异可能成为沟通的障碍。Seamless作为新一代AI语言翻译系统,通过SeamlessExpressive和SeamlessStreaming模型的首次发布,为实时、跨语言交流带来了全新的突破。
SeamlessExpressive是专注于语音到语音翻译的表达保留模型,而SeamlessStreaming则是一种流式翻译模型,以约两秒的延迟提供最先进的结果。这两个模型都基于SeamlessM4T v2,这是在8月份发布的基础模型的最新版本,展现了在自动语音识别、语音到文本、文本到语音等方面的性能提升。
与以往在表达性语音研究方面的努力相比,SeamlessExpressive更加关注韵律的某些未被充分探索的方面,例如语速和节奏停顿,同时保留情感和风格。该模型目前在英语、西班牙语、德语、法语、意大利语和中文之间的语音到语音翻译中保留了这些元素。
SeamlessStreaming的突破性在于实现了与说不同语言的人实时对话。与传统系统在说话者完成句子后进行翻译不同,SeamlessStreaming在说话者仍在说话时进行翻译,使得对话更接近实时。该模型支持近100种输入输出语言的自动语音识别和语音转文本,以及近100种输入语言和36种输出语言的语音到语音翻译。
除了模型本身,Seamless还在今天发布了metadata、数据和数据对齐工具,旨在帮助研究社区收集更多的翻译数据。这包括SeamlessAlign的扩展元数据,涵盖额外115,000小时的语音和文本对齐,以及SeamlessAlignExpressive的元数据,作为表达性焦点版本的数据集。此外,还提供了mExpresso的翻译文本数据,这是Expresso的多语言平行扩展,以及用于收集更多翻译数据的工具。
Seamless作为新一代AI语言翻译系统,在实现表达保留和流式处理方面取得了重要进展,为跨语言交流提供了更加自然和真实的体验。
MLC Chat app上架App Store 让手机原生跑大模型
近日,CMU助理教授陈天奇在社交平台上公布了一个好消息:MLCChatapp已经在苹果的AppStore上线了。据报道,MLCChat使用MLC-LLM作为基础,该模型由陈天奇和其他多名研究人员共同开发。该模型的最大特点是允许用户在任何设备上编译和运行大型语言模型,包括移动设备、电脑和网页端。站长网2023-06-05 21:07:030000价格更低!比亚迪海豚荣耀版上市官宣:内外都有新配色
快科技2月20日消息,据比亚迪汽车官方,旗下纯电动轿车海豚荣耀版将于本月23日上市。该车位小型纯电车,长宽高分别为4125/1770/1570mm,但得益于纯电平台,轴距达到了惊人的2700mm,新款车型外观变化不大,新车将拥多项升级,新增亚特兰蒂斯灰、热浪绯红纯色外观,并提供全新五孔花鳍轮毂。0000国内首款AI商拍工具——WeShop 可给真人模特一键换衣
站长网2023-07-27 16:58:5700023带火淄博引爆抖音,本地生活直播榜藏了多少秘密?
2023年,万亿级本地生活市场硝烟再起,“新贵”不断涌现,挑战王者地位的同时,也在重塑行业生态与格局。抖音大力出奇迹,正在成为该市场的一支重要力量。谁是这场本地生活大混战的获益者?商家还是达人?那些百万粉丝、单场直播千万成交额的达人,他们又是谁?他们是如何做到的?接下来还有那些潜在机会?站长网2023-05-04 18:18:030001我用AI开咖啡馆,10平月入6万
抱着低成本创业的心态,阿杰(化名)在广东佛山,开了一家用AI设计日报的报刊亭咖啡馆。而刚刚开业不到2个月,阿杰便拿下了每月6-10万元的营收,去年一整年的营业额达到70万元,投入却仅有10万元。在此之前,阿杰从未有过开咖啡馆的经验。站长网2024-04-22 09:13:460001