谷歌发布 “Vlogger” 视频模型框架:单张图片生成 10 秒视频
站长网2024-03-20 15:23:182阅
划重点:
⭐️ 谷歌发布新视频框架 “Vlogger”,可以通过单张图片和录音生成本人演讲视频。
⭐️ Vlogger 模型基于扩散模型,包含音频到人体动作和文本到图像模型。
⭐️ Vlogger 具备多样性和自然性,可应用于视频编辑和翻译等领域。
谷歌最近发布了一项名为 “Vlogger” 的新视频框架,可以通过仅一张图片和录音即可生成一个本人演讲视频。
这一框架基于扩散模型,包含音频到人体动作和文本到图像模型两部分。其中,音频波形被用来生成人物的身体控制动作,包括眼神、表情、手势等,使生成的视频看起来自然且生动。该模型训练在一个包含80万个人物视频的大型数据集上完成。
Vlogger 的突出之处在于其多样性和完整性。与其他方法相比,Vlogger 不需要对每个人进行训练,也不依赖于面部检测和裁剪,生成的视频包括面部、唇部和肢体动作等。此外,Vlogger 还具有视频编辑和翻译等应用,能够让人物闭嘴、闭眼,甚至进行视频翻译。
虽然谷歌尚未发布具体模型,但通过展示效果和论文,可以看到 Vlogger 在视频生成领域的潜力和优势。然而,一些网友对其生成视频的画质、口型对不上等问题提出了质疑和吐槽。尽管如此,Vlogger 的发布仍引起了业界的广泛关注和讨论。
谷歌发布的 Vlogger 模型为视频生成领域带来了新的可能性,具备多样性和自然性,为视频编辑和翻译等应用提供了新的解决方案。随着技术的不断进步和完善,相信 Vlogger 将在未来有更广泛的应用和发展。
产品入口:https://top.aibase.com/tool/vlogger
0002
评论列表
共(0)条相关推荐
一加13将搭载全新哈苏超光影旗舰三主摄:10月31日正式发布
一加手机在10月24日发布了一加13系列的影像系统细节。这款手机搭载了全新的哈苏超光影旗舰三主摄,包括一颗新一代5000万像素的潜望式长焦镜头,并内置了与OPPOFindX8系列相同的影像算法。一加官方强调,一加13的哈苏影像系统进行了全面升级,凭借强大的硬件和算法,能够轻松捕捉到令人惊艳的照片和视频,为用户提供超越专业级别的影像体验。0000一公司违法售卖QQ靓号、群号 被法院判赔150万元
近日,广东自由贸易区南沙片区人民法院审结一宗涉QQ账号交易不正当竞争纠纷案,判决出售QQ号的公司及个人赔偿150万元。腾讯公司为进行QQ号管理和保护用户个人信息,制定了相应管理规则,明确规定未经许可,不得赠与、借用、租用、转让或售卖QQ号码或者以其他方式许可其他主体使用QQ号码。站长网2023-04-24 17:17:080000周鸿祎:大家对大模型充满不切实际的膜拜
**划重点:**1.🧐周鸿祎在中国企业领袖年会上提到AI大模型热潮。2.🤔曾有人向他咨询养猪大模型,但他强调大模型技术尚有短板。3.🚀周鸿祎呼吁实事求是,正确看待大模型能力与未来潜力。在2023中国企业领袖年会上,360创始人周鸿祎就当前的AI大模型热潮发表了看法。他指出,人们对大模型存在着一种无限的向往或者不切实际的膜拜,甚至曾有人找到他,希望合作开发养猪大模型。0000京东自营推出“免费上门退换”服务 将覆盖超九成第三方商家
随着春节假期的结束,京东服务再次迎来了全新的升级。这一次,京东自营率先推出了“免费上门退换”服务,为消费者带来了前所未有的便利。凡是打标有“免费上门退换”标签的商品,无论大小、轻重,还是数量多少,都可以享受到免费上门退换的待遇。这意味着用户不再需要为退换货支付任何运费,既省钱又省心,还省去了自行处理的繁琐过程。站长网2024-02-22 14:04:210000Google Performance Max推生成式AI广告工具 商家轻松创建高质量广告内容
划重点:-Google推出新的AI生成工具,可用于广告制作,包括标题、描述和图像。-广告代理和没有内部创意团队的企业都可以利用这一工具,通过文本提示不断迭代生成广告内容。-Google承诺不会生成相同的图像,以避免竞争对手使用相同的广告元素。站长网2023-11-08 09:56:580000