谷歌推设计神器“StyleDrop”,给一张图就能复刻作品风格
只要给出一张图片作为参考,StyleDrop就能学习图片的风格,并帮助生成复刻出同风格作品。据称,谷歌的方法优于 Dreambooth、LoRA 或 Textual Inversion 等其他方法。
谷歌的新方法可以使用Muse(Muse 是一种文本到图像的生成视觉转换器)文本图像模型合成特定风格的图像。StyleDrop 捕捉自定义样式的复杂性,包括配色方案、阴影、设计模式以及局部和全局效果。根据谷歌的说法,所需的操作只需输入一张图片即可。大家可以看看以下官方案例:
设计出原风格的水彩绘画:
设计出原风格的logo:
设计出原风格的字母:
StyleDrop通过微调少量可训练的网络参数来学习新的风格,然后通过人工或自动反馈的迭代训练来提高模型的质量。
学习速度快且示例很少
具体来说,StyleDrop 在输入图像上进行训练并生成一组图像来重现该图像。从这些图像中,最高质量的图像通过 CLIP 评分或人工反馈选出,并用于进一步的训练。如果图像不是重现原始图像的内容,而是重现原始图像的风格,则该图像被认为是高质量的。
该团队表示,即使加上工反馈,整个过程也不到三分钟。这是因为 StyleDrop 无需大量的图片来进行迭代训练。
据该团队称, StyleDrop 优于其他从文本到图像模型的样式转换方法,包括 Dreambooth、LoRAs 和Imagen和Stable Diffusion中的文本反转。
与其他方法和模型相比,使用 Muse 的 StyleDrop作品效果
官方还称,StyleDrop 能够捕捉各种风格的纹理、阴影和结构的细微差别,明显优于以前的方法,从而比以前模型更能控制风格。
该团队还将 StyleDrop 与 Dreambooth 相结合,以学习和创建不同样式的新对象作为图像,并可以使用 Muse 的方法以自定义样式创建自定义对象。
StyleDrop学习一种风格,Dreambooth学习一个新对象,比如一只狗
谷歌将 StyleDrop 视为一种多功能工具,其中一个用例是允许设计师或公司使用他们的品牌资产进行训练,并以他们的风格快速制作新想法的原型。
StyleDrop项目网址:https://styledrop.github.io/
同花顺推出首个金融领域应用大模型问财HithinkGPT
同花顺日前推出自研的问财HithinkGPT大模型,并用于升级同花顺问财这一投顾对话机器人,成为国内第一家在金融领域应用大模型技术的企业。此次升级的问财投顾机器人,采用自主研发的HithinkGPT大模型,可以提供股票、基金、债券等15个金融业务领域的投资建议。新版本问财涵盖投资决策的多个环节,包括查询、分析、对比、预测等在内的50余项功能,能为投资者提供全面和精准的投资支持。0000微软推出安卓版Copilot 可免费体验GPT-4功能
要点:1.微软推出安卓版Copilot,免费提供GPT-4服务,绕过OpenAI的次数限制。2.Copilot支持基本对话、文本生成、图像识别等功能,但语音回复相对于ChatGPT仍有改进空间。3.用户可免费使用GPT-4的多模态能力,包括图像识别和DALL·E3生成图片,每日上限通过登录可提高至30条。站长网2023-12-27 14:12:100001GPT-Engineer一夜爆火!一个提示生成整个代码库,GitHub狂飙19k星
【新智元导读】动嘴写代码指日可待!AI代码生成明星项目GPT-Engineer一夜爆火,短短几天狂揽19k星。AutoGPT之后,又一个明星项目诞生了!GPT-Engineer一夜之间火遍全网,GitHub项目已经狂揽19k星。这是一个根据指示生成代码的AI工具,你只需要「动动嘴」,就能直接构建整个代码库。站长网2023-06-22 01:58:510000雷军同款小米汽车工装开售:限量800件 299元
今日,小米商城迎来了一款备受瞩目的新品——雷军同款小米汽车工装,其售价定为299元,并且限量发售仅800件。这款工装以其独特的设计和精致的品质,迅速吸引了广大消费者的目光。站长网2024-03-25 18:21:530000讯飞星火大模型V3.5升级 推出长文本、长图文、长语音大模型
科大讯飞今日发布重大更新,讯飞星火大模型V3.5升级,不仅推出了首个长文本、长图文、长语音大模型,还首次将多情感超拟人合成技术引入市场,并同步推出了星火智能体平台。这一系列创新举措,旨在为招投标应用和合同应用提供更为强大的技术支持。站长网2024-04-26 12:14:190002