ElevenLabs推出长音频生成平台Projects 可将书籍变成有声读物
近日,人工智能公司ElevenLabs推出了名为Projects的长篇音频生成和编辑平台。该平台汇集了公司在长篇语音合成、音频调教和并行音频生成等领域的研究成果,使创作者、出版商和独立作者能够在几分钟内为整个对话段落、新闻文章甚至有声书生成配音,全部在一个工作流程中完成。
Projects与语音合成、VoiceLab和语音库一起,作为一个独立的工具为长篇音频创作提供一站式解决方案。它还与专业语音克隆、语音库和多语言模型无缝集成。用户可以一键渲染整个项目,也可以选择渲染并重新生成特定的音频片段,同时保持上下文的连贯性。
体验地址:https://elevenlabs.io/projects
该产品提供了端到端的工作流程,用户可以直接从网页链接、电子书、纯文本或PDF文档导入内容,然后为不同的文本片段指定语音,并进行细微的语音编辑,如调整语速、增强清晰度等。然后只需一键生成完整的语音版本。
Projects为用户提供了直观的界面和多种编辑功能。ElevenLabs表示,Projects汇集了他们在长篇音频生成领域的最新研究成果,旨在让长篇音频生成尽可能简单。该公司希望这个新平台可以帮助用户将故事栩栩如生地呈现出来。
Projects具有以下核心功能:
支持直接从链接、电子书、纯文本和PDF文档导入内容
为不同文本片段指定不同语音/角色
支持28种语言,90多种语音
可调整语音参数如稳定度、清晰度、增强等
可细节编辑特定语音片段
可手动调整段落之间的停顿时间
一键生成语音文件输出
可以随时保存编辑进度
Projects使内容创作者能够以前所未有的效率将文字作品转换成引人入胜的有声内容,为网站文章、有声读物、播客等创作带来了革命性的进步。该产品简单高效的工作流程和强大的语音生成能力,令ElevenLabs在语音合成领域处于领先地位。
LeCun发文质疑LLM推理能力 大模型涌现离不开上下文学习
要点:LeCun认为,大语言模型(LLM)缺乏规划推理能力,其涌现能力主要源自上下文学习而非真正的推理。研究表明,针对复杂规划任务,如国际规划大赛中的问题,LLM的性能较差,其推理能力在特定领域受限,而涌现能力主要体现在简单任务和事先知道答案的情境中。站长网2023-11-24 18:05:530000英伟达公布第二财季财报:净利润61.88亿美元 同比增长843%
英伟达公布了截至2023年7月30日的2024财年第二财季财报,显示其营收达到135.07亿美元,同比增长101%,净利润为61.88亿美元,同比增长843%。调整后每股收益为2.70美元,超出分析师预期。站长网2023-08-26 10:25:190000打好地基,小红书强绑SPU
前几天聚光平台上线了强绑定SPU,有同学觉得麻烦死了,为啥要强绑,不绑不能投?其实不仅聚光平台如此,蒲公英平台也有强绑情况出现,所以无论是不是喜欢,SPU必定是要贯穿在小红书生态里的一个功能,只能去接受它。但是,你可能想知道,小红书为啥要强绑SPU?SPU的意义是什么?今天我们来一起聊聊。01什么是SPU?0000Rask AI :一款本地化视频翻译工具 支持60多种语言
RaskAI是一款一站式本地化视频翻译工具,内容创作者只需上传视频、点击几下即可把视频翻译成60多种语言。RaskAI借助"文字转语音"和"语音克隆"技术,你不再需要请配音演员就可以在视频里添加专业的画外音。并且经过AI转换,连视频字幕和声音都能直接被翻译,同时保留了视频内真人本来的音色!站长网2023-08-10 17:48:450007OpenAI在中国申请“GPT-6”“GPT-7”商标 此前表示GPT5已在训练中
天眼查App显示,近日,欧爱运营有限责任公司(OPENAIOPCO,LLC)申请多枚“GPT-6”“GPT-7”商标,国际分类为科学仪器、网站服务,当前商标状态均为等待实质审查。站长网2023-12-01 17:02:290000