微软携手Project Gutenberg利用AI语音技术制作5000本免费有声书
站长网2023-09-12 10:39:300阅
美国 IT 巨头微软公司近日与古Project Gutenberg合作,利用人工智能技术为该计划的电子书库制作了超过5000本高质量的有声书。这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。
图源备注:图片由AI生成,图片授权服务商Midjourney
项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等前沿的文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。
据悉,此次计划已收集整理了超过35000小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户甚至可以用自己录制的少量语音,生成用自己的声音朗读整本书的效果。这一项目能极大地丰富有声书的内容,也为视障人士提供了便利。
Project Gutenberg是免费数字图书馆计划,用户可以在其网站免费阅读和下载超过7万本电子书。此次与微软合作制作有声书,将大幅拓展其免费有声书数量,为公众提供便捷的知识获取渠道。
0000
评论列表
共(0)条相关推荐
YouTube 整合 AI 驱动的配音工具 Aloud:将视频自动配音成其他语言
YouTube正在测试一项新工具,利用人工智能帮助创作者将他们的视频自动配音成其他语言。该公司在VidCon上宣布与AI动画配音服务Aloud合作,后者是谷歌旗下孵化器Area120的一部分。站长网2023-06-25 23:41:080000Benifei:欧盟人工智能法案将成为全球规则的蓝本
欧盟议员BrandoBenifei周三表示,他预期欧盟人工智能法案将作为全球各国立法的「蓝本」。在多个国家探索如何监管AI的同时,欧洲立法者通过起草AI规则率先行动,旨在为几乎所有行业和企业的关键技术设定全球标准。这些草案规则可能在下个月获得批准。站长网2023-11-09 16:34:510000不再BeReal?一款必须BeFake的社交App融资300万美元
但有趣的是,2023年,仍然有厂商在部分借鉴BeReal的模式推出新产品,且已经拿到融资。8月,一款名为BeFakeAI的App上线,并在月底宣布获得了KhoslaVentures领投的300万美元种子轮融资。从游戏玩家行为中,发现与“追求真实”完全相反的需求站长网2023-09-05 11:02:520000艺电、育碧等游戏大厂采用AIGC技术革新自身生产流程 但人仍是内容产业的核心
站长之家(ChinaZ.com)4月19日消息:据WSJ报道,随着AIGC技术在游戏产业的广泛应用,越来越多的游戏公司开始思考如何利用这一技术革新自身的生产流程,以创建更为出色的游戏作品。站长网2023-04-19 14:20:150001视频快速移动抖动问题有解了!FMA-Net可恢复视频高清稳定状态
FMA-Net是一种非常有前景的视频处理技术,它能够将模糊的低分辨率(LR)视频恢复成清晰的高分辨率(HR)视频。不仅如此,当拍摄对象移动得非常快或摄像机快速移动时出现模糊状况时,FMA-Net也能够将视频恢复成稳定的高清状态!项目地址:https://top.aibase.com/tool/fma-net站长网2024-01-15 12:06:490001