网易开放免费声音复原技术,让听障人士用自己的声音 “说话”
站长网2023-07-21 17:06:401阅
近日,网易集团和网易公益联合浙江省残疾人福利基金会发起了名为 “人生第一句” 的声音复原公益计划。该计划利用网易互娱 AI Lab 的 iSpeech 技术,开发了一款能够复原听障人士原声的工具。
官方介绍,听障人士只需要上传5分钟没有完整语义的发声片段,然后输入想要表达的文字,就能够用自己的声音说出来。这项技术已经在音书 App 上线,并向全国听障人士免费开放,帮助他们无障碍地与外界交流,并用自己的声音说出 “人生第一句”。
据了解, 传统的语音克隆产品需要输入完整的讲话数据,对于无法正常发出语义的听障人士来说并不适用。因此,网易互娱 AI Lab 研发团队利用 iSpeech 技术,结合海量数据的预训练模型和少量纯语音数据的快速微调算法模型,开发出了首个听障人士声音复原工具。这个工具可以实时用原声流畅表达,只需输入文字即可。
目前,这个声音复原工具已经在音书 App 上线,供听障人群免费使用。同时,在浙江省杭州市马塍路残疾人融合就业街区也进行了试点应用,帮助听障咖啡师、面包师等更好地工作。
0001
评论列表
共(0)条相关推荐
做出了10亿+月流水游戏的厂商,如今照着出海产品的思路做新游?
2023年全球手游市场最引人瞩目的新品爆款,当属美国厂商Scopely旗下的社交博弈游戏「MONOPOLYGO!」。这款得到经典桌游「大富翁(Monopoly)」IP加持的产品,最早在2022年6月上线,2023年4月在美国iOS端正式上线。「MONOPOLYGO!」是2024年5月全球手游月流水Top1,超过「王者荣耀」|图片来源:SensorTower站长网2024-06-29 22:37:110001AI视野:ChatGPT用户可以访问互联网了;Photoshop网页版正式推出;微调多模态大模型会灾难性遗忘
📰🤖📢AI新鲜事ChatGPT用户可以访问互联网了!OpenAI宣布ChatGPT用户现在可以浏览互联网,不再受限于2021年9月之前的数据。这一更新允许用户访问最新信息,拓展了ChatGPT的应用领域。🚀AiBase提要:1.💡ChatGPT现在支持浏览互联网,不再受限于2021年9月前的数据。站长网2023-09-28 15:17:260000佛山电翰达8.7亿次播放 抖音再现“造梗”实力
抖音的造梗能力真的可怕,这些年,在抖音推荐机制的作用下,网友看遍了各种类型的话题爆火。从早期的停车场跳舞,到蚂蚁手指舞,从全民潘周聃,到大街小巷“挖呀挖”。所有你想不到的瞬间,都能突如其来的火爆全网。最近,抖音又为网友推荐了一位主播,其不仅外形酷似张翰,表演的甩手拧螺丝动作还出现了“人传人”的迹象。1佛山电翰打螺丝8.7亿次观看站长网2023-10-13 11:47:130000小鹏P7i磷酸铁锂电池版上市 售价22.39万起
小鹏汽车宣布其P7i车型新增两款车型上市,售价区间为22.39-23.99万元。这两款车型的最大亮点是采用了容量为64.4kWh的磷酸铁锂电池,CLTC续航里程达到了550km。值得一提的是,新款P7i的Max版还支持城市高阶智驾功能,预计在2023年11月覆盖25个城市,12月覆盖50个城市,2024年覆盖200个城市。站长网2023-11-06 11:38:130000给大模型补脑?腾讯发布ELLA,让SD模型提示词理解能力更强
腾讯昨天发布了一个名为ELLA的项目,这是一个高效的大语言模型适配器,能够无需训练就增强现有SD模型提示词理解的能力。ELLA将强大的大语言模型整合到文本到图像的扩散模型中,从而显著提升模型处理文本对齐的能力,而不需要额外对U-Net或大语言模型进行训练。项目地址:https://top.aibase.com/tool/ella站长网2024-03-14 10:48:200002