开源，可商业化！性能比Stable Difusion强2.5倍

站长网2023-12-07 09:31:490阅

文生图平台Playground宣布开源Playground V2版本，允许商业化，用户通过文本就能生成3D、动漫、素描、朋克、暗黑等多种类型1024x1024图片，同时提供免费在线体验。

Playground V2是基于Stable Diffusion XL开发而成，还从Midjourney搜集了10个类别，每个类别包含3000个样本的高质量图片用于图文对齐。

根据测试数据显示，在超过1000个文本提示中，Playground V2生成图片的受欢迎程度远远超过Stable Diffusion XL。

免费体验地址:https://playground.com/

开源地址:https://huggingface.co/playgroundai/playground-v2-1024px-aesthetic

Playground V2是在Stable Diffusion XL基础上开发的，所以架构上二者几乎差不多。但其从Midjourney搜集的10个类别的高质量样本，在数据微调时发挥了关键作用。

Playground V2采用了更大参数的UNet作为主干模型，是之前Stable Diffusion模型的3倍。

同时额外添加了多个模块包括:基于Fourier特征编码的大小及裁剪坐标条件，用于控制生成图像中对象位置;

基于多个宽高比的多宽高比训练，生成不同形状比例的图像;文本编码器方面使用CLIP ViT-L和OpenCLIP ViT-bigG的特征拼接。此外还采用了独立的细节增强网络来提升主模型生成图像的视觉质量。

此外，考虑到真实图像分辨率及宽高比差异很大，研究人员为使模型适应不同宽高比的训练数据，收集了20种不同宽高比的数据，尽量保证像素数接近1024*1024，通过在训练时切换宽高比数据进行模型微调。

Playground V2生成的图片欣赏

Playground V2生成的图片在光线搭配、阴暗对比、还原文本描述、色彩等方面，都非常不错，无法使用Midjourney、DALL·E3和Stable Difusion的小伙伴们可以试试。

蛇缠绕着女人，非常美丽，水粉画，电影风格，书法线条，黑暗，怪异，神秘，现代复古，丰富的深色，波西米亚风格。

本文素材来源Playground官网

女孩和熊，复杂的皮毛和织物纹理，数字绘画、发光效果、超精细、戏剧性的灯光，女孩的表情令人回味。

本文素材来源Playground官网

蛋糕卷和草莓，干净的白色背景，写实风格，3D效果

本文素材来源Playground官网

超美味的牛排，电影效果，专业美食摄影，影棚灯光，影棚背景，广告摄影，复杂细节，超细致，超真实，8K超高清。

本文素材来源Playground官网

盘子里盛满了色彩缤纷的寿司卷、天妇罗蔬菜和小碗里冒着热气的味噌汤。新鲜的鱼切片，视觉和气味令人陶醉。米醋、芥末酱、腌姜、酱油和绿茶，让每一口食物都更加美味。8K超高清，写实。

本文素材来源Playground官网

戴黑帽子的女巫，穿着黑色连衣裙，巴洛克风格，时尚拍摄，微妙色调的背景，超级微距，，复杂逼真的细节，影棚效果，动态照片，专业照片，工作室摄影，8K超逼真，写实风格。

本文素材来源Playground官网

灰色的外星人，呈现出不同色调的蛇皮纹理，融合了机器人颈部特征，超大迷人的眼睛反射着镜面全息效果，站在全息森林沼泽中，戴着有毛利金丝装饰的威尼斯铁面具，8K超高清。

本文素材来源Playground官网

开源 可商业化性能比StableDifusion强25倍

0000

评论列表

共(0)条

相关推荐

站长资讯
独立开发变现周刊（第133期）: 副业项目10个月赚了10万美元
目录1、Marvin:自动填写Stripe测试卡和支付信息的浏览器扩展2、Gitify:一款开源菜单栏通知桌面端应用3、Habitually:快速、直观的日记与健康追踪应用4、【增长策略】如何通过Reddit获取前100位用户5、副业项目不到10个月时间里赚了10万美元1、Marvin:自动填写Stripe测试卡和支付信息的浏览器扩展
站长网2024-05-17 09:08:37
0000
10个赚钱的小建议！
各位村民好，我是村长你现在一年可以赚多少钱?现在大环境的影响，普通人想赚点钱挺难的。我曾经也是一个月只有三四千的人，毕业第一年3500、第二年老板涨了300工资，但我选择了辞职，拿到了6000元月薪。现在8年过去了，我的月薪早已过万，那么我是如何改变的呢?今天和大家分享一下，我这些年对于赚钱的一些理解。01先从小钱开始不要瞧不起小钱，任何人都是从亏损、微利开始的。
站长网站长资讯2024-01-23 09:12:43
0000
站长资讯
Kimi Chat背后模型月之暗面moonshot正式开放API申请
KimiChat背后的模型，Moonshot模型，现已正式开放API申请，开发者可以接入Moonshot大模型来开发自己的应用。moonshot与OpenAI的API完全兼容，用户可以方便地进行迁移。该模型的最大上下文长度为128K。申请地址:https://top.aibase.com/tool/moonshot-aikaifangpingtai
站长网2024-02-06 11:04:26
0008
站长资讯
每秒500token的“网红”芯片Groq让人惊叹，但人们开始担心它的可用性
这两天国内外人工智能圈子都在热议Groq:这个硅谷公司的产品基于自研芯片可以做到在大模型推理时每秒处理将近500个token。
站长网2024-02-21 14:08:26
0000
站长资讯
BBC 正在阻止 OpenAI 数据抓取：计划与企业合作找出生成式 AI 最佳用途
站长之家(ChinaZ.com)10月7日消息:英国最大的新闻机构BBC已经明确了其在评估生成式人工智能使用时将遵循的原则，包括用于新闻研究和制作、档案和「个性化体验」。图片来自BBCBBC国家总监RhodriTalfanDavies在一篇博客文章中表示，该广播公司相信这项技术提供了向「我们的受众和社会提供更多价值」的机会。
站长网2023-10-07 09:48:43
0004