微软携手Project Gutenberg利用AI语音技术制作5000本免费有声书
站长网2023-09-12 10:39:300阅
美国 IT 巨头微软公司近日与古Project Gutenberg合作,利用人工智能技术为该计划的电子书库制作了超过5000本高质量的有声书。这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。
图源备注:图片由AI生成,图片授权服务商Midjourney
项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等前沿的文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。
据悉,此次计划已收集整理了超过35000小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户甚至可以用自己录制的少量语音,生成用自己的声音朗读整本书的效果。这一项目能极大地丰富有声书的内容,也为视障人士提供了便利。
Project Gutenberg是免费数字图书馆计划,用户可以在其网站免费阅读和下载超过7万本电子书。此次与微软合作制作有声书,将大幅拓展其免费有声书数量,为公众提供便捷的知识获取渠道。
0000
评论列表
共(0)条相关推荐
欧盟产业负责人将在 6 月与 OpenAI 首席执行官讨论 AI 法规
欧盟产业负责人ThierryBreton将在下个月与OpenAICEOSamAltman在旧金山会面,讨论OpenAI如何实施欧盟地区领先的人工智能(AI)法规。不愿透露姓名的欧盟官员表示,Breton还将与Altman讨论AI协议,旨在让OpenAI加入欧洲和非欧洲公司的行列,以在2026年规定实施之前应用这些AI法规。站长网2023-05-31 14:36:210001假新闻和嘲笑逝者——微软的人工智能新闻聚合出了什么问题?
站长之家(ChinaZ.com)11月6日消息:最新的一篇CNN报道通过一些例子展示了MSNAI模型在新闻聚合方面的问题,如突出显示一则声称美国总统乔·拜登在为毛伊岛野火受害者默哀时打瞌睡的新闻(实际上并没有),或是一则错误地将一名NBA球员描述为「无用」的讣告。站长网2023-11-06 08:58:320001iPhone SE4可能推迟到2025年发布 配备苹果自研基带
关于第四代iPhoneSE的谣言自2022年推出当前型号几个月后就一直在流传。下面,我们回顾了有关该设备的谣言,包括潜在功能和发布时间。站长网2023-07-06 09:43:400001360智脑API平台正式开放 首先为20个行业提供解决方案
6月28日,360集团创始人周鸿祎在GPT产业联盟成立大会上发布了360企业级AI大模型战略,并宣布360智脑API平台正式开放,将首先为20个行业提供解决方案。据了解,360智脑行业解决方案将率先在安全、传媒、文旅、政务、能源等近20个行业落地,为企业级用户构建包括“办公写作大脑、决策分析大脑、知识管理大脑、客户服务大脑、文旅招商大脑”在内的“五个智慧大脑”。站长网2023-06-29 11:39:580000AI视野:Adobe发布视频模型ActAnywhere;SVD将强势升级;新壹视频大模型通过备案;三星Galaxy AI两年内将开启付费
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用Adobe发布视频模型ActAnywhere可根据主体运动生成背景【AiBase提要:】😊可根据前景主体运动和外观生成背景站长网2024-01-22 16:09:270000