亚马逊发布其有史以来最大的文本转语音模型 BASE TTS
划重点:
⭐️ 亚马逊 AGI 团队发布了有史以来最大的文本转语音模型,具有最多的参数和最大的训练数据集。
⭐️ 新模型名为 BASE TTS,拥有980亿参数,使用了10万小时的录音数据进行训练,主要是英语。
⭐️ 该团队计划将 BASE TTS 用作学习应用,以改进文本转语音应用的人类声音质量。
亚马逊 AGI 的人工智能研究团队宣布开发了他们所描述的有史以来最大的文本转语音模型。所谓最大,是指拥有最多参数并使用最大训练数据集。他们在 arXiv 预印服务器上发布了一篇论文,描述了该模型的开发和训练过程。
与 ChatGPT 等大型语言模型(LLMs)因其人类化的智能回答问题和创建高水平文档的能力而备受关注不同,人工智能正在逐步应用于其他主流应用。在这一新尝试中,研究人员试图通过增加模型参数的数量和扩充训练基础来改进文本转语音应用的能力。
这一新模型被称为 Big Adaptive Streamable TTS with Emergent abilities(简称为 BASE TTS),拥有98亿参数,并使用了10万小时的录音数据进行训练,其中大部分是英语。该团队还为其提供了其他语言中已知短语的口语单词和短语示例,以使模型在遇到这些短语时能够正确发音,比如 “au contraire” 或 “adios, amigo”。
亚马逊团队还在较小的数据集上对模型进行了测试,希望了解模型何时会出现所谓的新兴特性,即人工智能应用,无论是 LLM 还是文本转语音应用,突然似乎突破到更高层次的智能。他们发现,对于他们的应用程序来说,新兴特性出现在拥有1.5亿参数时。
他们还指出,这种飞跃涉及一系列语言属性,例如使用复合名词,表达情感,使用外语词汇,应用语音附加语和标点,以及在句子中将重点放在正确的单词上提出问题。
该团队表示,他们不会向公众发布 BASE TTS,因为他们担心它可能被不道德地使用,而是计划将其用作学习应用。他们希望应用他们迄今为止所学到的知识,以改进文本转语音应用程序的人类声音质量。
论文网址:https://dx.doi.org/10.48550/arxiv.2402.08093
新加坡目前还不打算监管人工智能 呼吁企业参与世界首个 AI 测试工具包「AI Verify」
新加坡采取观望态度,不打算对人工智能进行监管。新加坡资讯通信媒体发展管理局(IMDA)的可信人工智能与数据主管LeeWanSie在接受媒体采访时表示:「我们目前不打算对人工智能进行监管。」IMDA负责推广和监管新加坡的通信和媒体行业。站长网2023-06-21 16:57:540000麻省理工学院推GenSim项目:利用大语言模型编写机器人新任务
**划重点:**1.🌐MITCSAIL的“GenSim”项目利用大型语言模型(LLMs)如GPT-4,通过自动生成新任务或详细说明所需行为的每个步骤,扩大了机器人可以接受培训的仿真任务范围。2.🤖GenSim系统具有目标导向和探索两种模式,通过LLM生成任务描述和模拟行为所需的代码,然后利用任务库优化代码,最终生成能教导机器人执行新任务的仿真。站长网2023-11-29 11:27:310000月活10亿的TikTok,能为品牌出海提供什么新增量?
5月18日下午,TikTokforBusiness(TikTok旗下的全球移动营销平台)在深圳举办了SHOPNOW品牌电商出海营销峰会。TikTok坐拥10亿月活用户,早就被认为是下一个风口。因此,TikTok的一举一动都能够吸引众多业内机构及品牌商家们的目光。站长网2023-05-23 09:04:050000电商“变法”,AI维新
度过了一个春节假期后,开工的第一天,想必很多朋友都想不起来自己以前是干什么工作的了——电商人除外。大过年仍旧坚守岗位的电商从业者不少。今年,京东、小红书都作为2024央视春晚的唯二大厂,在全国观众面前刷了一把存在感。其中,京东是大家熟悉的传统电商巨头,努力通过春晚红包活动,激活新的增长。小红书则在“大家的春晚”直播中同步上架“春晚同款”,向电商领域大步进攻。站长网2024-02-19 09:03:280000百度:已有超300家伙伴参与文心千帆大模型平台内测
昨日,百度方面透露,目前已有超过300家伙伴参与文心千帆大模型平台内测,在400多个企业内部场景取得测试成效。百度表示,文心千帆大模型平台在多机多卡训练性能方面,可以更快达到收敛的状态,在全球权威AI基准评测MLPerf榜单中排名世界第一。站长网2023-05-19 11:24:590000