微软推文本转真人视频工具Deepfakes Creator
站长网2023-11-17 14:37:410阅
微软推出了一款名为Deepfakes Creator的工具,被称为Azure AI Speech的文本到语音化身。这个工具可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片,并写一个剧本,工具就能创建出逼真的人物化身视频,模拟人物说话。不仅如此,这个工具还支持多种语言,并能进行实时问答互动。此外,Deepfakes Creator还提供了个性化语音功能,用户只需提供一分钟的语音样本,就能快速复制用户的声音,用于定制语音助手和内容配音。

项目地址:https://github.com/Azure/gen-cv/tree/main/avatar/video
为了确保合法和伦理的使用,Deepfakes Creator禁止使用预录制语音,并要求用户明确同意使用并通过注册使用特定的用例。另外,为了辨认AI合成语音,工具会在个人语音中自动添加水印,并要求用户同意Microsoft使用水印检测服务。
Deepfakes Creator还可以简化传统视频制作流程,适用于制作培训视频、产品介绍等各种内容。同时,它还可以用于构建对话代理、虚拟助手、聊天机器人等,提供自然的交互式对话。工具的内容生成工作流程包括文本分析、TTS音频合成和TTS化身视频合成,生成与声音同步的嘴唇动画。
除了提供即用型的预构建化身,Deepfakes Creator还提供可定制化的化身选项。用户可以通过上传的视频录像进行训练,定制出符合自己需求的化身。
为了方便用户使用,Azure AI Speech Studio提供了UI工具和API访问支持。Deepfakes Creator可以广泛应用于创建各类吸引人的视频和交互式应用,提高沟通和信息传达的效率。
0000
评论列表
共(0)条相关推荐
多模态语言模型新基准AMBER 评估和降低模型中的幻觉问题
AMBER项目是针对多模式语言模型(Multi-ModalLanguageModels,MLLM)的一个新基准,旨在评估和降低模型中的幻觉问题。幻觉是指当模型在生成文本、图像或音频等多种模态的数据时,可能会产生不准确或误导性的结果。为了帮助研究者和开发人员更好地理解和解决这个问题,AMBER项目发布了一个开源库。站长网2023-11-17 14:32:400001抖音成为全球最赚钱的APP
抖音用户付费额全球第一打开手机刷短视频已经成为大部分人日常生活中娱乐的首选,说起短视频,想到的无非就是抖音、快手两个软件。从诞生到现在,抖音几乎到了“无人不知,无人不晓”的地步。抖音拥有国民级别的知名度,其吸金能力也不可小觑。站长网2024-02-20 14:18:510001贾跃亭回应第二阶段交付推迟:工业化和融资能力不足
就在刚刚,针对第二阶段交付推迟问题,FF创始人贾跃亭回应称,FF912.0FuturistAlliance是基于“FFaiHyper6x4Architecture2.0打造的极智科技顶奢的硅基新物种新品类“全能aiHypercar”,对工业化能力提出了很大挑战。站长网2023-06-22 11:27:200000Unity 首席执行官:人工智能将使游戏开发「更快、更便宜、更好」
最令人印象深刻的视频游戏世界需要数百名游戏设计师、图形艺术家和音乐家多年才能创造出来。Unity首席执行官JohnRiccitiello预测,生成式人工智能(AI)将将这一时间大幅缩短约五到十倍。Riccitiello在最近的美联社报道中对AI时代的游戏未来进行了思考。站长网2023-07-10 17:07:050002苹果 iPhone“电池门”赔款到账 每台手机获赔660元
快科技1月7日消息,苹果的电池门”事件,以苹果赔付5亿美元(约35.7亿元)和解迎来最终局面。而网友最新分享的信息显示,苹果当前已开始向用户发放赔偿金,有人已陆续获得打款,每份赔偿约92.17美元(折合人民币约660元),其中部分人可能受到总计近1000美元的赔偿。站长网2024-01-07 10:02:080000