从AI写真到AI扩图,图像应用更易出圈?
早在7月,美图秀秀官方微博就曾发文,称“AI 扩图”功能现已上线,美图秀秀 App 和 Wink App 均可以立刻体验 AI 扩图功能。而最近,妙鸭逐渐淡出互联网,AI扩图却接替了讨论热度。
而近日,快手自研文生图大模型“可图”(Kolors) 也开启内测。
事实上,从ChatGPT火爆全网后,国内的AI相关应用也相继出现在大众视野,但从此前的妙鸭,再到如今的美图秀秀,在C端出圈的多以图片生成类应用为主。
美图秀秀“截胡”妙鸭,快手在后?
“AI扩图也太牛了,直接拯救旅游废片”
“我真的要报警了,AI扩图出来的效果又搞笑又离谱”
“AI扩图扩得不错,下次不扩了”
……
最近在各大社交媒体平台,不难见到类似的美图秀秀AI扩图分享。
据官方介绍,该功能基于 AI 算法智能识别,可根据图像的上下文和纹理,预测、生成缺失的部分,能够为原始图片带来更大画幅、更广视角。
目前在美图秀秀 App 首页可找到入口,每人每天有5次免费体验机会,可对图像进行150%、200%、250%、300% 四种不同比例的扩图,系统预设比例为125%。
锌刻度留意到,在微博、小红书等社交媒体平台,已有不少网友发布自己的AI扩图图片。小红书上#AI扩图#话题已有高达2128.4万的浏览量,而抖音上同样的话题则有超两百万次播放量。其中在小红书上,最热的一篇相关笔记“被AI扩图吓晕,AI你的审美别太好”点赞量达3.3万。
不过,AI扩图出圈也呈现出两极评论,大部分需求为“调整构图,完善背景”的图片之所以出圈是因为效果不错,但也有不少令人直呼“离谱”的图片催化了AI扩图出圈,其中包括扩图时被补充了奇怪的衣服、增加了奇怪的肢体、出现了陌生的脸庞、悬浮在水中的头颅等等。
部分出圈的AI扩图照片
事实上,AI扩图并不算新鲜事物。早在今年五月底,Adobe Photoshop 测试版上线了一个名为 “Generative Fill”的 AI 图像合成工具;今年七月份,Midjourney 则更新了“平移扩图”功能,可以将图片自由前后平移,相较于之前推出的 “Zoom Out”功能里只能固定的“扩图1.5倍”或“扩图2倍”,显得更加人性化。
但对于国内的大部分人而言,对AI扩图的应用还是从美图秀秀开始的。目前对AI扩图的讨论也主要聚焦于美图秀秀。
值得一提的是,上一次引发对AI图片应用讨论热潮的,还是可以生成个人写真的妙鸭相机和生成芭比写真的“45AI”。然而,几个月过去,在社交媒体上,这两款小程序的讨论度已然下跌,取而代之的是或离谱、或吓人或“真香”的AI扩图。
如果说目前美图秀秀凭借AI扩图顺利“截胡”妙鸭,那不得不提醒一句,还有快手在后。
9月,快手在短视频评论开始内测“快手AI玩评”,而据官方介绍,快手“AI玩评”依托于快手自研文生图大模型“可图”(Kolors)强大的图像生成能力,用户可以通过输入各种创意文字,一键生成海量风格图片,可以更轻松、便捷地在评论区进行趣味互动。
不过,目前在各大社交媒体平台关于“可图”的讨论还较少。
为何图片生成类应用更易出圈?
回溯近几年来,国内 AIGC真正意义上破圈的现象级产品似乎大多都诞生在图片这条赛道。
“AI对话类的也玩过,但总觉得对话很傻,也并不如想象中有趣。但是像妙鸭、AI扩图我都用过,确实会经常收到意料之外的图片啊,不管是离谱的还是效果不错的,在社交平台发出来的讨论度都还不错。”20岁的桃子常年刷社交平台,对一切新鲜事物都很好奇,但相较于ChatGPT这一类的对话式AI,她更乐于尝试图片类应用。
“图像相关的应用软件确实更容易被用户接受和使用,因为在应用层面,人们对图像ai功能的要求偏工具化,用户对ai的预期是很明确的。” 祁隋是国内一科技企业的算法工程师,他告诉锌刻度,图片类应用更容易出圈还有技术方面的原因,“从全球来看,近10年的AI浪潮是从2012年的一场名为ImageNet的图像识别比赛中萌芽,所以AI模型结构也更适合在图像上应用,效果和效率都比文字更好,而在文字上的应用一直到2018年 Transformer结构被发明出来后,才算勉强势均力敌,应用领域离C端也相对较远,直到最近找到了生成式AI这个突破口,被大众所熟知。”
而在中国,文字内容生成比图像内容生成的难度也更大,“因为文本训练需要大量高质量的数据,中文数据从质和量上肯定都比英文数据更有挑战性。尤其是对话式AI是开放式的,任务也更为多元,对于数据质量和数量的需求更是跃升了一个量级。” 祁隋称。
不过,在祁隋看来,未来AI的发展方向是图像 文本的多模态大模型。“36氪”此前也曾提到,想要更接近通用人工智能,提高 AI 对图像、语音、视频等多模态内容的理解不可或缺。相较于注重文本交互的单模态语言模型,多模态模型能将 AI 领域拓展至识别、检测等更广泛的领域。
那么,下一个引发现象级关注的AI应用又会是什么呢?
腾讯微信视频号拟限制数字人带货
站长之家(ChinaZ.com)6月18日消息:腾讯视频号近日宣布了对《视频号橱窗达人发布低质量内容实施细则》的修订,旨在加强内容质量监管,并拟禁止数字人直播带货。该修订于今年6月7日至6月13日公开征集意见。在最新修订中,视频号将“挂机录播”概念扩展为“非真实直播”内容,明确禁止在直播过程中使用非实时直播内容或道具来替代真实直播。相关违规示例包括使用插件、AI等工具生成虚拟形象进行直播。站长网2024-06-18 20:40:330000想不起电影名字?Film Recommender只需通过简单文字描述即可匹配电影
FilmRecommender是一款电影个性化推荐与发现工具。它允许用户通过简单的文字描述,比如提供背景设定、情节、主题或演员等信息,来查找和发现感兴趣的电影。体验地址:https://filmfinder.ai/FilmRecommender具有以下核心功能和价值:1.个性化电影推荐站长网2023-08-28 10:15:130000被AI改变的00后娱乐习惯
初见文生图、文生视频的震撼还清晰如同昨日,硬糖君的记忆更停留在AI绘画导致LOFTER用户销号事件——可能是这个冷门社区近年来站得最高的一次。但不到两年时间,AIGC已经随风潜入夜。如果说AI翻唱、AI换脸、AI绘画还是在借助新工具进行自我表达,那么在互动同人文、AI智能体的方兴未艾中,最年轻的那波年轻人,已经毫无障碍地将表达本身也交给了AI。站长网2024-04-23 17:21:030000阿里达摩院推大语言模型PolyLM:通晓18种语言 拥有1.7B和13B两种参数版本
最近,阿里巴巴达摩院发布的一个名为POLYLM的多语言大型语言模型引起了人们的兴趣。与其他多语言模型不同的是,PolyLM能够在理解、推理和生成自然语言指令方面表现出显著的能力,该模型拥有1.7B和13B两种参数版本可选。官方的介绍是这样的:站长网2023-07-18 18:34:150000这届618,大厂互抄作业
没有任何一届618的激烈程度,能超过今年。作为618购物节的两大主角,京东与淘宝天猫同时喊出“史上最强618”,不仅折扣力度超越往年,行业投入规模也达到史上最高。电商平台的打法也变了。过去的几年里,618购物节一直用战壕战的方式,沿着一条成熟的路径缓慢推进。具体打法是跨店满减或全平台满减,配合定点发放的红包雨。预售期、品类日、狂欢日等节奏早就固定下来,购物高手一眼就能摸透。站长网2023-05-25 16:42:190000