Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群
Stable Diffusion要王者归来了?
Stability AI CEO Emad Mostaque最新推文,四段视频引人无数遐想。
不少网友怀疑,这是Stable Video Diffusion新版本的演示Demo。
因为从效果上看,不管是画面清晰度、一致性还是流畅度都十分惊人。
比如这只毛绒熊带着泳镜潜水。
毛绒熊动作十分流畅,甚至还眨眼睛。而背后也有丰富的海水细节。
再加上Emad Mostaque本人,自今年1月1日开始就消失了几星期,始终未曾在社交网络上露面。
网友觉得,这一波更像是憋了个大新闻。Stability AI is back?
(一度以为Stability AI已经在竞争中落后)
Stable Diffusion杀回来了?
从释出的四秒Demo来看,应该是针对SVD视频生成功能的升级。
不过基于文本还是图像生成尚不能断定,直接来感受一下效果。
还有这种动漫风夜晚的街道。
去年11月,Stable Video Diffusion(SVD)正式问世,当时除了支持图像、文本到视频之外,还支持物体3D合成。
按照当时透露的计划, SVD只是作为基础模型,接下来还将继续拓展,建立起整个Stable Diffusion的生态系统。
当时网友对Demo的反馈包括光影不对、而且整体不连贯(视频帧与帧之间闪烁)。
而从现在Demo看,以一个类似视频作对比:绿色机器人躺在床上。
可以看到,机器人,以及旁边的杯子灯盏,甚至床被枕头的褶皱细节都更为丰富了。
而且在机器人脸上也有明显的光影映射。
不过更多更新信息还得等官方版本发布才能知晓。
值得一提的是,在这条推文之后,Emad Mostaque还发了条类似的。
没有文字,四张静图。
网友们表示了期待。“希望这个模型能全方位地超越SDXL,并更好地及时迭代。”“这是SD3?”
不过这个地球西红柿是什么鬼???
又是同一天,他们的StableLM21.6B发布,一个只有16亿参数的小语言模型。它经过了英语、西班牙语、德语、法语、葡萄牙语和荷兰语等多语种训练。
几天前,他们刚发布新年以来第一个大语言模型Stable Code3B。
如此频繁的进展,Stability AI莫不是真的要翻身了?
决战视频生成
之所以要说翻身,因为Stability AI在上一波文生图赛道里的确备受瞩目,Stable Diffusion的爆火,让它一度成为全球最受关注的AI独角兽。
但随着Midjourney的出现,以及OpenAI谷歌在内的频繁进展,而内部也不安生,包括CEO疑似剽窃成果、挪用公款,公司商业模式不明晰、拖欠工资等情况爆雷,Stability AI一度陷入风波之中。
去年11月官宣进军视频生成赛道,彼时已经有runway和pika这样的热门玩家出现了。
如今SVD新版本疑似亮相,之所以受到众人关注,除了本身企业之外, 还同当下正在高能爆发的视频生成赛道密切相关。
不少网友直言:真是一波又一波的卷,一家比一家更卷。
要么是比版本发布迭代,这段时间国内大厂阿里字节等新进展频出。要么是从生成效果,清晰度、流畅性,前段时间,Moonvalley横空出世,惊呆不少人。
又或者在可控性等上面去卷……
这不就在前几天,runway的Gen-2再进化——
只需5个笔刷,对着一张图一顿刷刷刷刷刷,原本静止的小鸟们就各自运动了起来。
那么在视频生成这个赛道,你看好Stability AI吗?
参考链接:
[1]https://twitter.com/StabilityAI/status/1747352719487054105
[2]https://x.com/emostaque/status/1748405750907457548?s=46&t=HBob6gxh8cOfZTIbieKeSA
线下爆料,荣耀90 Pro首发3840Hz调光四曲屏,价格却出人意料
最近这段时间似乎各家都在打磨新机,随着六一八的即将到来,又有不少主打轻薄颜值的手机即将上市,都想在这个时期拿下不错的成绩。不过暂时来看,似乎荣耀90能成为那个最大的黑马,虽然还没有发布,但是在各种配置的爆料下,热度持续上升,而且在线下已经有不少宣传图的出现,很多人似乎都在等待荣耀90系列的发布。站长网2023-05-25 03:49:140001福布斯评10个最佳AI内容检测工具
站长之家(ChinaZ.com)注:ChatGPT、Claude和Bard等AI内容生成器经过海量文本和代码数据集的训练。他们可以模仿人类的写作风格,生成创意文本格式、翻译语言并编写创意内容。另一方面,AI检测器工具旨在帮助确定如何判断某些内容是否由AI编写。他们检查文本中是否有表明人工智能作者身份的特定模式和属性,例如句子长度和单词选择的低方差。站长网2023-12-15 14:58:490002智源研究院开源18种语言文图生成模型 利好中文用户
智源研究院发布了新款模型AltDiffusion-m18,该模型支持18种语言的文图生成,包括中文、英文、日语、泰语、韩语、印地语、乌克兰语、阿拉伯语、土耳其语、越南语、波兰语、荷兰语、葡萄牙语、意大利语、西班牙语、德语、法语、俄语。这是非常好的消息,因为现有的非英文模型选择非常有限,用户需要将prompt翻译成英语再输入模型,这使得整个过程非常复杂,同时也会影响生成图片的准确性。站长网2023-05-08 15:10:020000魅族21内置 4800mAh 电池 将于11月30日发布
魅族21再次进行预热,公布了其电池容量为4800mAh。魅族声称,配合OneMind10.5及三星OLED节能屏,该手机在0-100%极限续航模型测试下能够达到8.2小时,优于同样配备5100mAh电池的竞品(7.4小时)。除了强大的电池续航,魅族21将采用三星OLED直屏,支持1920Hz高频调光、SGS低蓝光认证、无频闪认证等,为用户带来更加舒适的使用体验。站长网2023-11-24 14:06:580000营销要为效果负责!短视频时代下的新内容营销方法论
一、以ROI评判内容的准确性“抖音电商,让我们首次看到了集曝光、种草和转化为一体的全链路新生态。”——美妆品牌XXX总监不可否认,抖音可以说是唯一万亿级集内容营销与销售转化为一体的全链路闭环交易平台。也是更务实的品效协同营销场域,而营销场的杠杆支点是“内容破圈,自带buff”,闭环链路平台的内容建设约等于品牌建设。站长网2023-05-16 11:50:410001