微软发布声音克隆技术Personal Voice 提供1分钟样本即可生成AI语音
站长网2023-11-17 11:17:142阅
微软近日发布了一项名为Personal Voice的新技术,该技术可以克隆用户的声音,并且能够复制出与原声音完全一致的人工智能语音。用户只需提供1分钟的语音样本,Personal Voice就能在几秒钟内生成相应的AI语音。
这项技术支持多达100种不同语言的语音输出,包括中文、西班牙语、德语等。Personal Voice利用设备端的机器学习技术,确保用户的个人信息安全,并与LiveSpeech进行无缝集成,让用户在与他人交流时可以使用Personal Voice的AI语音。
除了为语音助手、游戏、语言配音等应用提供个性化声音,Personal Voice还在娱乐、媒体领域有着广泛的应用。通过将用户的本声配音应用于故事、有声书、播客、视频等内容,可以使这些内容更加贴近用户,提升沉浸感。
微软还和海尔合作,将个性化声音引入其智能音箱和更智能的家电产品中,为品牌带来了创新的用户体验。微软的Personal Voice功能为用户提供了在短时间内实时复制自己声音的机会,使智能音箱更具家庭氛围,丰富了用户的生活。
该功能将在西欧、美国东部和东南亚地区率先上线,并于12月1日上线公共预览版。
微软强调了Personal Voice的责任使用。用户必须明确同意并录制声明,以确保对个人和社会权益的保护。微软承诺以有限的注册方式提供Personal Voice,仅限于特定用途。符合资格的客户可以将Personal Voice API集成到支持个性化声音的应用中,包括智能设备的语音助手和游戏中角色声音的定制。
此外,微软还在Personal Voice生成的声音中添加水印,以便用户可以识别是否使用了Azure AI Speech,并确定使用的是哪个声音。这为合规性和透明性提供了一层保障。
0002
评论列表
共(0)条相关推荐
LLM Guard:增强LLM安全性的开源工具包 安全使用各种等模型
文章概要:1.LLMGuard是一个旨在增强大型语言模型(LLMs)安全性的工具包,可轻松集成和部署在生产环境中。2.它提供了广泛的评估器,用于LLMs的输入和输出,包括清理、检测有害语言和数据泄漏,以及防止注入和越狱攻击。3.该工具包旨在简化公司对LLMs的安全采用,通过提供一站式的必要工具,希望成为市场首选的开源安全工具包。站长网2023-09-19 17:23:370003新华三集团发布私域大模型“百业灵犀”LinSeer
在近日的2023NAVIGATE领航者峰会上,新华三集团正式发布私域大模型——“百业灵犀”LinSeer。新华三集团表示,将利用大模型的力量,以四个“专”,为垂直行业和专属地域的客户,提供安全、订制、独享、生长的智能化服务。具体来说:行业专注:要和行业伙伴一起,打通垂直应用数据,形成精准、精确、精益的私域垂直智能,培养特定能力,帮助百行百业建设最懂“行”的私域大模型。站长网2023-06-12 16:57:3700019月小红书爆粉玩法:听爷爷奶奶跟你说
猜猜这个账号0粉到5万粉用了多久?答案是20天。这个号,8月30日发的第一条内容,截止到9月19日,一共发了27条笔记(删了2条),平均每天1-2条。新红在9月2日开始收录这个账号,收录的时候已经有7000粉丝了。收录前这个账号的笔记赞藏数量是6W,涨7000粉丝基本正常。站长网2024-09-23 01:14:320000荣耀Magic6、MagicOS8.0定档:将于1月10日发布
荣耀官方宣布,将在1月10日至11日举行一场重要的新品发布会,届时将正式推出荣耀Magic6系列旗舰手机,并发布MagicOS8.0操作系统。据此前曝光的信息显示,荣耀Magic6是一款足以对标华为超高端旗舰的产品。在这次发布会上,它将正式与公众见面。0000元象推出高定制语音方案 克隆语音最快只需5分钟数据
元象推出了高度定制的语音方案,通过多重技术手段实现高自然度的语音交互体验。该方案可以应用于客服、虚拟IP、直播、有声书、语音助手等领域。在XLand剧本对话游戏中,元象为不同角色提供个性化配音,增强了游戏的代入感。方案的优势包括高定制性、高自然度、高性价比,快速生成千人千面、高保真、高稳定性的语音,节约时间和人力成本。站长网2024-02-26 11:57:240001