微软携手Project Gutenberg利用AI语音技术制作5000本免费有声书
站长网2023-09-12 10:39:300阅
美国 IT 巨头微软公司近日与古Project Gutenberg合作,利用人工智能技术为该计划的电子书库制作了超过5000本高质量的有声书。这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。

图源备注:图片由AI生成,图片授权服务商Midjourney
项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等前沿的文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。
据悉,此次计划已收集整理了超过35000小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户甚至可以用自己录制的少量语音,生成用自己的声音朗读整本书的效果。这一项目能极大地丰富有声书的内容,也为视障人士提供了便利。
Project Gutenberg是免费数字图书馆计划,用户可以在其网站免费阅读和下载超过7万本电子书。此次与微软合作制作有声书,将大幅拓展其免费有声书数量,为公众提供便捷的知识获取渠道。
0000
评论列表
共(0)条相关推荐
AI鱼缸造景抖音获赞超12万 在AIGC的赋能下造景有了更多可能性
AIGC(人工智能图形生成)与景观设计的结合,为造景这门商业艺术带来了更多可能性。通过AI技术,可以在现实空间重塑自然景观,创造出令人惊叹的视觉效果。例如,抖音博主“时光印景”发布了一条用AI设计的鱼缸造景视频,展示了一条仙气飘飘的鱼游过黛绿色的群峰、桥梁和建筑的背景,给人一种超然物外的氛围感。站长网2023-09-06 17:35:580000微软Edge浏览器最新功能:Bing AI 帮你以不同风格重写文本
近日,微软更新了桌面版MicrosoftEdge浏览器,新增了使用BingAI重写文本的功能。此前,微软已经在iOS和Android上的SwiftKey键盘应用中推出了类似的功能。站长网2023-08-07 10:17:570000GPT-4绝对性能暴涨74.4%!UIUC苹果华人团队提出CodeAct,用Python代码统一LLM智能体行动
【新智元导读】最近,UIUC苹果华人提出了一个通用智能体框架CodeAct,通过Python代码统一LLM智能体的行动。一直以来,LLM智能体被众多业界AI大佬看好,甚至有望成为将人类从琐碎工作中解放出来的利器。但是,它们该如何与世界进行最佳互动?最近,来自UIUC和苹果的华人研究员,提出了一种全新的智能体框架——CodeAct。站长网2024-02-13 11:00:420000报告称ChatGPT移动端营收增长开始放缓
据Appfigures公布数据显示,ChatGPT移动端营收增长已开始放缓。在过去的几个月里,ChatGPT的营收增长一直保持在30%以上,其中7月份为31%,8月份为39%。然而,到了9月份,这一数字下降到20%。这可能是ChatGPT的用户数量接近饱和的一个迹象,或者反映出有多少移动用户不愿意为升级后的ChatGPT订阅服务付费。据悉,ChatGPT并不是收入最高的人工智能应用。站长网2023-10-10 08:47:220000苹果开发设备内运行的大型语言模型 优先考虑速度和隐私
据彭博社报道,苹果公司正在开发自己的大型语言模型(LLM)。这款模型将能够在设备上本地运行,从而优先考虑速度和隐私保护。报道称苹果公司的法学硕士正在为即将推出的生成式人工智能功能奠定基础。所有迹象都表明,这款LLM将完全在设备上运行,而不是通过云端运行,这与目前大多数人工智能服务的做法不同。站长网2024-04-22 09:49:240000