谷歌发布 “Vlogger” 视频模型框架:单张图片生成 10 秒视频
站长网2024-03-20 15:23:182阅
划重点:
⭐️ 谷歌发布新视频框架 “Vlogger”,可以通过单张图片和录音生成本人演讲视频。
⭐️ Vlogger 模型基于扩散模型,包含音频到人体动作和文本到图像模型。
⭐️ Vlogger 具备多样性和自然性,可应用于视频编辑和翻译等领域。
谷歌最近发布了一项名为 “Vlogger” 的新视频框架,可以通过仅一张图片和录音即可生成一个本人演讲视频。
这一框架基于扩散模型,包含音频到人体动作和文本到图像模型两部分。其中,音频波形被用来生成人物的身体控制动作,包括眼神、表情、手势等,使生成的视频看起来自然且生动。该模型训练在一个包含80万个人物视频的大型数据集上完成。
Vlogger 的突出之处在于其多样性和完整性。与其他方法相比,Vlogger 不需要对每个人进行训练,也不依赖于面部检测和裁剪,生成的视频包括面部、唇部和肢体动作等。此外,Vlogger 还具有视频编辑和翻译等应用,能够让人物闭嘴、闭眼,甚至进行视频翻译。
虽然谷歌尚未发布具体模型,但通过展示效果和论文,可以看到 Vlogger 在视频生成领域的潜力和优势。然而,一些网友对其生成视频的画质、口型对不上等问题提出了质疑和吐槽。尽管如此,Vlogger 的发布仍引起了业界的广泛关注和讨论。
谷歌发布的 Vlogger 模型为视频生成领域带来了新的可能性,具备多样性和自然性,为视频编辑和翻译等应用提供了新的解决方案。随着技术的不断进步和完善,相信 Vlogger 将在未来有更广泛的应用和发展。
产品入口:https://top.aibase.com/tool/vlogger
0002
评论列表
共(0)条相关推荐
波音公司正利用 AI 从庞大的数据中剔除安全隐患
波音公司正在利用人工智能来筛选海量的数据,并识别其飞机和航空公司运营中的潜在危险,以加强它在两起致命的737Max坠机事件之后试图增加的安全文化。站长网2023-05-25 15:41:490000憋大招!苹果2023年首度停更iPad
自2010年首次发布以来,苹果一直保持着每年推出至少一款新型号产品的惯例,深受消费者关注。然而,2023年却成为了一个例外,这一年里,苹果并未发布任何新款iPad,仅推出了USB-C版ApplePencil作为与iPad相关的唯一新品。事实上,iPad的最近一次更新还要追溯到2022年10月份。0000东方甄选首次启动app直播
东方甄选最新发布了全新版本的手机应用,并计划于7月5日至11日在该应用上举行甘肃专场直播活动。这是东方甄选成立一年以来首次在应用上举办类似的直播活动。据称,发布新版本的主要目的是为了进一步发展直播业务。站长网2023-07-04 14:40:270000实探ofo创始人戴威的美国咖啡店:目前不赚钱
5月19日消息,ofo创始人戴威赴美创业,开了一家名为AboutTimeCoffee(咖啡时光)的咖啡店。有博主实探AboutTimeCoffee咖啡店。他表示,该咖啡店目前在纽约有五家店,位置都在繁华地区,除了特色珍珠咖啡,售卖的还有常规咖啡,价格在2-4美元,和网红店营销方式一样,新用户首次下载app注册,还能免费送五杯。他们也在社交媒体上做了推广,目前咖啡店应该不赚钱。0000