实时AI,最难躺平的战场
有人预测2024将是视频之年,其实今年已经看出端倪。
年终将至,图像、视频生成战场仍然高潮迭起。
前阵子上线的 Pika Labs1.0炸了一波,Meta 又推出一个免费的 AI 图像生成器,口碑不错。
谷歌 DeepMind 最新文生图模型 Imagen2毫无悬念地登上了今天的头条 。如果有内测资格,你会发现谷歌搜索居然可以直接生图。
进入谷歌实验室,测试中的谷歌搜索可以直接生图了。
与此同时,之前热度不减、但一直处在内测阶段的 AI 设计工具 Krea AI Beta 版也终于开放,现在可以免费体验(部分功能)。
与一般文生图工具稍有不同的是,Krea AI 主打一个实时性。它是一个创意工具包,除了当红的实时生成工具(Real-time Generation )、增强工具( upscale&enhance ),还有几个特定功能的小工具。
背靠2,500多个 AI 模型,Krea AI可以应对不同艺术风格品味的需求。尤其是实时生成工具,凭借惊人的生成速度和对画面效果的精准控制,备受瞩目。
实时生成工具提供四种生成方式(界面左边):文本到图片、图生图、屏幕(比如截屏、壁纸)生图、直接拍摄生图。
还可以选择几种图片效果(界面右边),比如没有指定风格、插图、电影、流光等。
Krea AI的网页产品界面
中间是一个看板,也是体验何谓「实时」的地方—— 输入文本提示时,每敲一个单词、或者删除一个单词,图片内容都会立刻随之变化。
比如,当我们输入「一个叫尼尔斯的男孩」时,画面是这样的:
输完 「一个叫尼尔斯的男孩儿,骑着一只飞翔的大鹅」时,画面变成了这样:
当我们继续添加「带条围巾」时,画面又变了:
与「文生图」不同,「图生图」对作品效果控制力更好。因为除了文本,你还可以借助一些简单的线条、色块工具,涂鸦几笔,勾勒作品的大致轮廓,供机器加强「理解」。
我们先用工具画了个非常简单的猪头:
然后,输入文本提示「一头微笑的猪」,结果就出来了:
这是网友的作品,是不是很漂亮:
一位网友仅用四分钟,就将自己孩子一样的涂鸦变成了一幅逼真的 AI 肖像:
来自x平台网友titus
这是官方给到的展示:
正如前文所述,除了文本、涂鸦,你还可以通过捕获设备屏幕的内容(比如网页、视频)或者用摄像头获取图片来源,然后输入文本提示,生成新的图像作品。
实时生成图片,难免模糊、分辨率低,你还想让作品细节更完美,这时,Upscale & Enhance 就派上用场了—— AI 能以更高分辨率、甚至想象力重新创建视觉内容。因为是付费服务,我们选用了一些官方和网友的体验案例:
你可以调节 AI 发挥自己创造力的程度,如果很高的话,原图被修改的幅度也会很大。比如,这个作品里,美女的脸都被换了。
来自x平台Dona Mara
这也是 AI 生成工具和传统数学算法类润色工具的主要区别,前者会用自己的想象力替换像素内容,而不是刻板遵守。
除了速度和效果,任何新设计工具要想具有生命力,还必须具有良好的兼容性——能与常见的设计工具无缝对接,比如Photoshop、Illustrator、Figma、Blender、Sketchfab 等。Krea 也是如此。
另外,Krea AI 还有一个引人注目的功能——能与 iPad 无缝连接。看,这个孩子寥寥数笔就创造了蜘蛛侠:
另外,Krea AI 还有两个特定功能的小工具,但都不提供实时生图体验。输入要求后,需要等一定时间才能看到结果。
一个是 AI pattern ,输入文本提示,再选择你要的图案,即可以生成带有该图案的图像。
图片来自 https://ratemyaitools.com/author/rakeshai/
图片来自https://ratemyaitools.com/author/rakeshai/
另一个是 Logo Illustration 。和 pattern 功能类似,只不过图案变成了这里的 Logo,专门生成 Logo 形状相关图像。
图片来自https://ratemyaitools.com/author/rakeshai/
图片来自https://ratemyaitools.com/author/rakeshai/
写到这里,还没卷完。
其实,在 Krea AI 推出增强工具之前,他的竞争对手Magnific AI 已经发布了类似功能:
x平台网友Dave Villalva,用Magnific AI重制《星球大战》预告片
除了图片,AI 的增强能力还被扩展到视频上。
Upscale-A-Vide是南洋理工大学S-Lab 实验室开发的一个用于视频超分辨率的时间一致性扩散模型,结合低分辨率视频和文本提示,能将低分辨率视频转换为高分辨率。
是啊,谁不想看到童年最爱卡通片的4k 版本?
实时生图方面,不想 Krea AI 专美于前, Leonardo AI 前几天也宣布推出实时绘图工具「实时画布」。
Freepik 的实时草图到图像生成器「Pikaso」也上线了,让涂鸦立刻变成画作:
更疯狂的,Decohere AI 也预告了他们新的实时 AI 视频生成平台。
有兴趣尝试的网友,这里是一些传送门
文中视频:https://mp.weixin.qq.com/s/lBKXNnC5If4hYgTvH78wmw
https://www.krea.ai/home
https://www.freepik.com/pikaso
https://leonardo.ai/
https://magnific.ai/
智源悟道3.0“Emu”模型开源
智源研究院发布了首个全能多模态预训练模型Emu的开源版本。Emu在多项性能指标上超越了DeepMind的Flamingo模型,具备统一多模态学习框架和视频数据的大量采用的能力。Emu可以完成任意图生文和文生图的多模态任务,包括图像描述、图像问答、视频问答、文图生成、图像融合和多模态对话等。Emu还具有强大的少样本上下文学习能力,可以根据给定任务的几个示例样本进行上下文学习。站长网2023-07-14 16:31:070000俞敏洪建议董宇辉出国留学 可边直播边上学
新东方创始人俞敏洪在东方甄选直播间中表示,自己最大的遗憾是没有出国留学,并建议主播董宇辉去国外学习,可以上白天学校,晚上直播赚学费。董宇辉称,俞老师已经帮他规划了全球最顶尖的学校。据悉,俞敏洪曾经历两次高考失败,最终考上北大英语系,但经贫穷困扰,未能出国留学。他随后离开北大创办了新东方。站长网2023-04-21 09:28:180000vivo x90s今天正式发布:天玑9200 芯、3999元起
6月26日消息,今天下午vivo召开了新品发布会,会上发布了vivox90s新款旗舰机,这款手机搭载天玑9200处理器,售价3999元起,有青漾、至黑、告白和华夏红四种配色。站长网2023-06-27 17:06:510001谷歌 DeepMind 高管表示人工智能将有助于应对气候变化
谷歌DeepMind高管ColinMurdoch表示,人工智能有潜力加速改变世界的创新,例如「无限」的清洁能源和更好的气象模型,帮助人们应对气候变化的影响。他在BNNBloomberg电视台上说:「我们正在使用人工智能预测天气,以提供更准确的天气预报,帮助世界各地的社区和公司适应日益极端的天气。」站长网2023-06-29 23:46:190001“AI文生图”著作权案一审生效 被告被判赔偿原告500元
近日,北京互联网法院审结了一起涉及AI生成图片的著作权侵权案件,对于AI生成内容的著作权保护问题做出了明确的判决。案件中,原告使用开源软件StableDiffusion生成了一张涉案图片,并在小红书平台上发布。被告在百家号上发布文章时使用了该涉案图片,未经许可并且截去了原告的署名水印。原告认为被告侵犯了其署名权和信息网络传播权,要求公开赔礼道歉并赔偿经济损失。涉案图片的生成过程0000