微软携手Project Gutenberg利用AI语音技术制作5000本免费有声书
站长网2023-09-12 10:39:300阅
美国 IT 巨头微软公司近日与古Project Gutenberg合作,利用人工智能技术为该计划的电子书库制作了超过5000本高质量的有声书。这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。
图源备注:图片由AI生成,图片授权服务商Midjourney
项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等前沿的文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。
据悉,此次计划已收集整理了超过35000小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户甚至可以用自己录制的少量语音,生成用自己的声音朗读整本书的效果。这一项目能极大地丰富有声书的内容,也为视障人士提供了便利。
Project Gutenberg是免费数字图书馆计划,用户可以在其网站免费阅读和下载超过7万本电子书。此次与微软合作制作有声书,将大幅拓展其免费有声书数量,为公众提供便捷的知识获取渠道。
0000
评论列表
共(0)条相关推荐
微软 CEO 否认对 OpenAI 的控制 强调小公司在人工智能领域仍有竞争机会
最近接受采访的微软首席执行官萨提亚·纳德拉否认了埃隆·马斯克的说法,称微软并没有掌控OpenAI,而是由其董事会管理。纳德拉强调了OpenAI公司独立的决策过程,突显了业界在人工智能进展速度上的不同观点,并表达了他相信小公司有机会与微软和谷歌等巨头竞争的信念。纳德拉表示:「OpenAI非常专注于其非营利董事会控制的使命。我们在其上没有控制权,但在商业上有着良好的合作伙伴关系。」站长网2023-05-18 16:25:140000谷歌 Gboard 全力发展生成式 AI:加入人工智能校对和表情符号生成功能
人工智能是今年GoogleI/O开发者大会的关键词,谷歌展示了生成式语言模型如何改变其一些重要产品。看起来该公司正准备将同样的魔力添加到Gboard中,这几乎是最好的Android键盘应用程序。在应用程序中隐藏的标志可以激活一系列生成式机器学习功能,如高级拼写检查和表情符号生成。站长网2023-08-11 09:04:4100028何小鹏:小鹏MONA M03下月上市 8月1日起陆续到店
快科技7月30日消息,今日晚间,小鹏汽车举办AI智驾技术发布会,会上,何小鹏表示MONAM03将于8月1日起陆续到店,并将在8月举办正式发布会。何小鹏称,他开MONA时发现比他开的所有20万及以下的车,MONO都是碾压性的,性能动态的体验非常的棒。他一开始都认为,他们不可能把MONA做的又好看又可接受,又能够做到各方面能力的平衡,但是他觉得这对小鹏是一个巨大的飞跃,结果他们真的做到了。站长网2024-07-31 00:13:380000巨头环绕之下,AI绘画网站的生存术
最近,OpenAI宣布DALL—E3正式上线ChatGPTPlus和企业版,这意味着,AI绘画对于OpenAI不再只是个图新鲜的玩具,而是开始实打实地赚钱了。从行业的角度来说,这似乎是一种必然。质量越高,性能越好的AI绘画,所具有的技术壁垒也就越高,而在此基础上构筑的”付费墙”,也就成了顺理成章的事。可问题是,目前的AI绘画赛道上,除了三巨头之外,仍存在着数量庞大的开源AI绘画。站长网2023-10-28 10:41:420000腾讯为何用「顶流」来捧它?
相安无事五年后,国内的游戏巨头腾讯又一次和网易发生了正面对决。12月15日,腾讯发布了全新的派对手游《元梦之星》,上线五天内在应用商店排名一度超越网易同品类手游《蛋仔派对》。在12月21日的iOS免费游戏排行榜上,《元梦之星》排在首位,网易《蛋仔派对》则屈居第四。当然,目前《元梦之星》的热闹也都再情理之中,毕竟铺天盖地的营销活动背后是腾讯用真金白银提供的“无限弹药”支持。0000