Google全新发布AI视频Veo2、AI绘图Imagen3 - 何以凌越。
大半夜的,OpenAI的垃圾直播没任何看头,就发了个个性化的AI搜索。
但是,Google没有预告、没有营销,默默的在X上发了两个大货。
当今最先进的AI视频模型Veo2,还有AI绘图模型Imagen3改进版。
我们一群人,一边看效果,一边不断的惊呼卧槽。
我几乎从来不使用炸裂这个词,但是AI视频Veo2的效果,真的让我有点想欢呼,甚至,有点像2月16号那个宿命的一夜,看Sora的感觉。
一个一个来说。
一. AI视频Veo2
不说废话,先看视频。
说实话,这些视频,我都不愿意转成gif,而是直接传视频上来给大家看。
这个审美、这个稳定性、这个真实质感、这个物理规律,当得起当今最强的称号。
真的,物理之神,特别是那个切番茄的视频,我一度真的怀疑是实拍的,太恐怖了。
而且,我看了一圈Prompt,发现对拍摄风格、角度、运动等等的语义理解,都极佳。
比如这个汽车飞驰的视频,Prompt里写的就是:
“低角度跟踪镜头,18mm 镜头。汽车漂移,留下光线和轮胎烟雾的轨迹,创造出视觉上引人注目且抽象的构图。相机低位跟踪,捕捉到流线型的橄榄绿色肌肉车驶向一个拐角。当汽车进行戏剧性的漂移时,镜头变得更加风格化。旋转的轮子和翻滚的轮胎烟雾,在周围城市灯光和镜头光晕的照射下,形成了在黑色沥青上划出的光线和色彩的条纹。城市景观--黄色出租车、霓虹灯和行人--变成了模糊的抽象背景。体积光照增加了深度和氛围,将场景转变为一个视觉上引人注目的运动、光线和城市能量的构图。”
有那么多的开车的AI视频镜头,而这,是我看过的最好的,没有之一。
还有,能直接对一个运动的物体,用Prompt来对其进行超级稳定的多轮材质变化。
稳定到起飞,这也是我第一次,能在AI视频里,见到如此稳定的特效变换的。
Google自己也做了一个人类观察者的评测,通过Meta发布的基准数据集 MovieGenBench,做了1003个数据,来让大家盲测,哪个效果更好。
最后得到的结果,是这样的。
这块我稍微解释一下,有两个表,分为Overall Preference(整体偏好度)和Prompt Adherence(提示匹配度)。
每个图表的横轴表示不同的被对比模型,分别是Meta、可灵v1.5、Minimax、Sora Turbo。
Google做的是把Veo2跟这些模型做点对点的盲测。真的,国产模型居然也能作为对比基准了,突然有一股热血涌上心头。。。
而每个柱由三个部分组成,颜色代表结果分类:
绿色部分(Veo):评测者在对比中更偏好Veo输出的比例。
白色部分(Ties):评测者认为两者不分上下,即没有明显偏好的比例。
粉色部分(Other preferred):评测者更偏好另一模型(非Veo)的比例。
以Google DeepMind浓眉大眼的一贯作风,基本不会造假,所以能看到,Google的Veo2在大多数情况下,取得了最优结果。
而在Google的评测里,除了Veo2之外,另外四个模型里,最强的是可灵v1.5,这个结果也是挺有趣的。
而且,有一点是需要注意的,Veo2,是可以直出4K视频的。
他们在Youtube上传的视频,也是原生4K,这个就非常的恐怖。
他们自己也说,目前最大的难点和限制,还是在运动上。
原话是:“创建真实、动态或复杂的视频,并在复杂场景或具有复杂运动的场景中保持完全一致性仍然是一项挑战。”
来看一下他们的Badcase。
说是Badcase,但是我感觉他们发出来的时候估计脸上也都带着笑,那意思就是:
给你们看看,爷的运动有多强。
有瑕疵,但是对比Sora这种,这运动质量,已经吊炸天了。
Veo2网址在此:https://labs.google/fx/tools/video-fx
需要排队,直接填一份表单就好。
按照Google的性格,排队肯定要不了多久,不是OpenAI那种纯粹耍猴的,绝不可能一等就是半年,应该很快就能用上。
OpenAI的这波12天直播,感觉彻底把路人缘败光了,之前Google一直被OpenAI恶心的头疼,而这次,直接彻底反击。
你喜欢狙我是吧,来来来,这次Gemini2、Veo2、Imagen3我一个一个放,你不是喜欢抢热度吗?来啊,这次来抢啊,看谁抢谁啊小兔崽子。
老虎不发威,你还当我Google是病猫了?
二. AI绘图Imagen3
除了Veo2之外,Google这波还直接发了他们改进版的AI绘图Imagen3模型,其实严格来说,是Imagen3-002模型,Imagen3的第二代。
第一代Imagen3是2024年5月14日,在谷歌的I/O开发者大会上发的。
半年过去,Google对Imagen3进行了一次大幅的进化,推出了改进版的第二代,他们自己的评测上,直接屠榜。
网址在此:https://labs.google/fx/zh/tools/image-fx
目前无需排队,可以直接玩,而且,免费。
直接在输入框里写Prompt,就可以开始玩。
他们这个Prompt的设计,也很有意思,你可以输入各种奇奇怪怪的一大串Prompt,他会自动给你拆解分词,有点像老罗当年那个胶囊大爆炸的感觉,把一些词分出来后,给你变成下拉框,自动联想几个其他的选项。
比如我的prompt是:
一个穿着巴斯光年服装的小黄人,身穿带翅膀的太空游侠套装,站在一个五彩缤纷的玩具店里,指着天空,仿佛准备起飞,背景是满满的玩具架,生动而富有活力的风格,中景。
一个非常简单的Prompt,我们翻译成英文后,扔到Imagen3里。
你会发现它在运行之后,会给你选中一些词变成下拉。
比如它把wings单独拎了出来,你点下拉后。
可以自动替换成喷气背包、火箭助推器、滑板车等等,非常有意思。
我们按照它的联想,把背饰换成喷气背包、背景换成电子游戏机房、姿势改成挥手告别,再跑一张看看。
这个交互,真的很通人性。我太喜欢了。
再放一些我跑的图。
整体看下来,有一种感觉就是,下限贼低,很吃Prompt,要是Prompt写不好,那其实也会出不少很丑的图。
但是语义理解真的挺不错的,上限目前没太测出来,可能还不错。
但是不太适合新手玩。
写在最后
OpenAI这段时间的直播,彻底把人缘败干净了。
看了一圈,几乎都在骂。
不管是国内,还是国外。
再遥想今年2月16号,Google的Gemini1.5Pro被OpenAI的Sora淹的彻底没了声量,而现在,整个局势,好像反了过来。
甚至,很多人都没发现,之前Sora的大功臣,都已经跳槽到Google DeepMind了。。。
营销这事,真的是一把双刃剑。
现在这OpenAI的局面,真的都是自己造的。
万物皆轮回。
不要把自己作没了。
让全红婵痴迷,义乌老板疯狂赶工,“乌龟对对碰”到底是个啥?
最近,直播间里“拆乌龟”火了。这种玩法叫做“乌龟对对碰”,就连奥运冠军全红婵,也十分迷恋这些小乌龟。全红婵回国后,还发布了一条视频,晒出了自己收藏的小乌龟。有大有小,密密麻麻的,看上去估摸着得有几百只。还有不少网友晒出“乌龟大军”,直呼太上头。那么这个“乌龟对对碰”到底是个啥?为什么会这么火?玩法:盲盒对对碰站长网2024-08-19 18:10:510000网易:第一季度营收269亿元 同比增长 7.2%
网易今日发布了其截至2024年3月31日的第一季度财务报告,数据显示公司净营收达到了269亿元,同比实现了7.2%的稳健增长。在净利润方面,公司实现了76亿元,与上一季度的66亿元和上年同期的68亿元相比,呈现出稳定的增长态势。若不计入美国通用会计准则,净利润更是达到了85亿元,高于上一季度的74亿元和上年同期的76亿元。站长网2024-05-24 10:42:470000巴菲特去年大赚6900亿元 明确接班人为阿贝尔
近日,伯克希尔哈撒韦公司发布了2023财年年报,同时公开了巴菲特的第46封股东信。在这封信中,巴菲特明确表示格雷格·阿贝尔已全面准备好接任伯克希尔哈撒韦公司的CEO一职。阿贝尔在伯克希尔哈撒韦公司中扮演着举足轻重的角色,负责监管公司的非保险业务,包括能源、铁路、零售、金融产品和制造业等领域。他的职业生涯始于2000年,加入公司董事会,并于2008至2018年间担任伯克希尔能源公司的首席执行官。站长网2024-02-26 08:48:430000淄博烧烤,带火五一“山东游”
“小饼烤炉加蘸料”的烧烤三件套,正在成为年轻人的新晋社交暗号。截至目前,抖音平台上“淄博烧烤”话题的视频总播放量超过62亿,两个月内18次霸榜微博热搜,小红书关于“淄博”的笔记达66万篇。而在这些社交平台上,随处可见周末去山东进行”特种兵式旅游”的大学生,以及求“五一组队”、求“烧烤搭子”的年轻人。站长网2023-04-20 18:16:550001“妙鸭相机”推出支付宝小程序
近日,火爆出圈的AI应用“妙鸭相机”正式推出了支付宝小程序版本。从7月17日正式上线以来,“妙鸭相机”就以9块9获得高质量写真照引发了网友大量关注,高峰期一度有4000-5000人排队。目前,其支付宝小程序刚上线就吸引了超6万用户访问。同时,妙鸭还在支付宝上开通了生活号。站长网2023-08-11 12:40:050000