一上线就爆火出圈!中文语音AI天花板ChatTTS官网上线
还记得之前给大家推荐的中文语音AI天花板ChatTTS吗?这个可平替 GPT-4o的文本转语音项目一上线就爆火出圈,短短几天就在GitHub上斩获了16.9K的Star 量。
而现在,ChatTTS正式上线了官网,所有用户都可以直接在线体验了。
主要功能:
文字转语音:在文本框中输入文字,ChatTTS会生成对应的语音,并自动调整韵律和停顿。
实时语音对话:与大语言模型结合,实现实时语音对话功能。
调节音色:在“Audio Seed”处可以调节数字指定说话人的音色,或通过摇骰子随机生成一种音色。
控制细节:用户可以在文本中加入特殊标记如[laugh]和[uv_break],手动控制笑声和停顿等效果。
ChatTTS的突出特点
多语言支持:ChatTTS不仅支持中文,还能够生成自然流畅的英文语音。中英文混合语音表现出色,几乎听不出AI生成的痕迹。
细粒度控制:ChatTTS允许用户控制笑声、说话间的停顿以及语气词,使生成的语音更加自然和生动。
多说话人支持:ChatTTS支持多说话人的语音合成,可以复刻各种声音,包括已故人物的经典声音。
大规模训练数据:最大的ChatTTS模型使用了超过10万小时的中英文数据进行训练,在HuggingFace开源的版本使用了4万小时的训练数据,但未经过监督微调(SFT)。
ChatTTS的应用场景
ChatTTS适用于各种需要高质量语音合成的场景,包括但不限于:
电商直播:为直播提供更加自然的语音配音,提高用户体验。
自媒体:帮助自媒体创作者生成生动的配音,吸引更多观众。
在线教育:为在线课程提供清晰自然的讲解声音,提升学习效果。
客服和售后服务:提供更人性化的语音服务,提高客户满意度。
在线使用
官网地址:https://chattts.com/
项目地址:https://top.aibase.com/tool/chattts
text:指的是需要转换成语音的文字内容。
Refine text:选择是否自动对输入的文本进行优化处理。
随机度:一个控制输出随机性的参数,数值越大,生成的语音随机性越高,这可能导致生成的语音质量有时更好,有时更差。
声音选择:默认值为2222,这是一个数字参数,用于选择声音的类型。可选的数字有2222、7869、6653、4099、5099,可以任选其一,或者输入其他数字以随机选择声音。
定制声音:这是一个正整数参数,用于定制声音的音调和音色。如果设置了此值,将优先使用,而忽略声音选择参数。
提示设置:用于添加笑声、停顿等效果。例如,可以设置为[oral_2][laugh_0][break_6]。
再次强调,该模型的优势在于它是开源的,允许使用个人的声音资料进行训练。
使用时,请遵守法律法规和道德规范。
另外还有人做了一个ChatTTS Web UI,自己可以部署
ChatTTS Web UI:https://github.com/jianchang512/ChatTTS-ui
AI芯片需求激增,美光科技首次在六个季度内实现收入增长
**划重点:**1.💹美光科技首次在六个季度内实现收入增长,部分原因是人工智能芯片需求激增。2.🧠公司新推出的HBM3E内存芯片模块备受投资者青睐,预计在2024财年将为公司带来数亿美元的收入。3.💻美光看好人工智能在个人电脑和移动设备中的应用,计划增加在2024财年的资本支出,以满足新内存模块的生产需求。0000最近的AI视频,真成了CP党的“第一次工业革命”
最近可灵和luma的AI视频是真的火出圈了。甚至我在网上冲浪的时候,都能刷到不少画风新奇的作品。比如B站上,你一搜AI整活,全是。大多都还挺……魔幻的:容嬷嬷和紫薇大快朵颐、卢本伟吃屏幕,甚至还有些邪门的AI接吻视频。还有,经典的,华强卖瓜,但是AI版。够辣眼睛,也够好笑。刘华强和卖瓜摊主的CP,物理意义上的“相爱相杀”。站长网2024-07-12 14:22:570000微软研究员发布EmotionPrompt方法:增强多语言模型的情感智能
划重点:-研究关注情感智能对多语言模型的潜在影响,提出了EmotionPrompt方法。-使用情感提示显著提高生成任务性能,验证多语言模型具备情感智能潜力。-结果表明多语言模型的情感智能可以通过情感刺激来增强,有望改进各种应用领域。微软研究员最近发布了名为“EmotionPrompt”的研究成果,旨在增强多语言模型的情感智能。站长网2023-11-10 15:14:360000WPS AI智能办公助手海外版开启公测
据36氪消息,WPS海外版智能办公助手WPSAI开启公测,由OpenAI和PaLM2提供大模型支持。目前,WPSAI在Windows和Android端的WPSOffice的文字和PDF组件上可用。未来,它将嵌入到文字、演示文稿、表格和PDF四大组件。站长网2023-07-27 16:39:590000字节发布ResAdapter 可以解决Stable Diffusion肢体异常、画面崩坏问题
近日,字节发布了一款名为ResAdapter的新型工具,该工具可以解决StableDiffusion(SD)在生成超大图片以及非训练分辨率图片时出现的肢体异常和画面崩坏问题。此外,ResAdapter还可以与现有的IPadapter以及Controlnet模型兼容。站长网2024-03-06 14:20:440003