开源,可商业化!性能比Stable Difusion强2.5倍
文生图平台Playground宣布开源Playground V2版本,允许商业化,用户通过文本就能生成3D、动漫、素描、朋克、暗黑等多种类型1024x1024图片,同时提供免费在线体验。
Playground V2是基于Stable Diffusion XL开发而成,还从Midjourney搜集了10个类别,每个类别包含3000个样本的高质量图片用于图文对齐。
根据测试数据显示,在超过1000个文本提示中,Playground V2生成图片的受欢迎程度远远超过Stable Diffusion XL。
免费体验地址:https://playground.com/
开源地址:https://huggingface.co/playgroundai/playground-v2-1024px-aesthetic
Playground V2是在Stable Diffusion XL基础上开发的,所以架构上二者几乎差不多。但其从Midjourney搜集的10个类别的高质量样本,在数据微调时发挥了关键作用。
Playground V2采用了更大参数的UNet作为主干模型,是之前Stable Diffusion模型的3倍。
同时额外添加了多个模块包括:基于Fourier特征编码的大小及裁剪坐标条件,用于控制生成图像中对象位置;
基于多个宽高比的多宽高比训练,生成不同形状比例的图像;文本编码器方面使用CLIP ViT-L和OpenCLIP ViT-bigG的特征拼接。此外还采用了独立的细节增强网络来提升主模型生成图像的视觉质量。
此外,考虑到真实图像分辨率及宽高比差异很大,研究人员为使模型适应不同宽高比的训练数据,收集了20种不同宽高比的数据,尽量保证像素数接近1024*1024,通过在训练时切换宽高比数据进行模型微调。
Playground V2生成的图片欣赏
Playground V2生成的图片在光线搭配、阴暗对比、还原文本描述、色彩等方面,都非常不错,无法使用Midjourney、DALL·E3和Stable Difusion的小伙伴们可以试试。
蛇缠绕着女人,非常美丽,水粉画,电影风格,书法线条,黑暗,怪异,神秘,现代复古,丰富的深色,波西米亚风格。
本文素材来源Playground官网
女孩和熊,复杂的皮毛和织物纹理,数字绘画、发光效果、超精细、戏剧性的灯光,女孩的表情令人回味。
本文素材来源Playground官网
蛋糕卷和草莓,干净的白色背景,写实风格,3D效果
本文素材来源Playground官网
超美味的牛排,电影效果,专业美食摄影,影棚灯光,影棚背景,广告摄影,复杂细节,超细致,超真实,8K超高清。
本文素材来源Playground官网
盘子里盛满了色彩缤纷的寿司卷、天妇罗蔬菜和小碗里冒着热气的味噌汤。新鲜的鱼切片,视觉和气味令人陶醉。米醋、芥末酱、腌姜、酱油和绿茶,让每一口食物都更加美味。8K超高清,写实。
本文素材来源Playground官网
戴黑帽子的女巫,穿着黑色连衣裙,巴洛克风格,时尚拍摄,微妙色调的背景,超级微距,,复杂逼真的细节,影棚效果,动态照片,专业照片,工作室摄影,8K超逼真,写实风格。
本文素材来源Playground官网
灰色的外星人,呈现出不同色调的蛇皮纹理,融合了机器人颈部特征,超大迷人的眼睛反射着镜面全息效果,站在全息森林沼泽中,戴着有毛利金丝装饰的威尼斯铁面具,8K超高清。
本文素材来源Playground官网
微信上线秒简相机APP 集成拍摄、影像美化、拼图分享等功能
据Tech星球报道,近日,微信在AppStore上推出了一款名为“秒简相机”的应用程序,这是一款结合了拍摄、影像美化、拼图分享于一体的相机类工具产品。根据官方介绍,这款应用程序可以让用户轻松按下快门,立即获得满意的影像效果。站长网2023-09-19 09:01:190000吃“有毒”数据,大模型反而更听话了!来自港科大&华为诺亚方舟实验室
现在,大模型也学会“吃一堑,长一智”了。来自香港科技大学和华为诺亚方舟实验室的最新研究发现:相比于一味规避“有毒”数据,以毒攻毒,干脆给大模型喂点错误文本,再让模型剖析、反思出错的原因,反而能够让模型真正理解“错在哪儿了”,进而避免胡说八道。具体而言,研究人员提出了“从错误中学习”的对齐框架,并通过实验证明:站长网2023-10-28 13:49:210000小红书投放成本越来越高?如何建立流量主权?
上周1个认识很久的消费品客户,告诉我不做小红书了。根源在于发现平台的投放成本越来越高,当时投放ROI在2左右,还能支撑去做,现在投放成本越来越高,再投下也没有太大意义。讲一下客户背景,从淘宝转战小红书,也是平台比较喜欢的付费玩家,高峰期小红书广告日耗2W,主投企业号,引流到淘宝。类似此类商家停投的故事还有很多,为什么会出现情况?站长网2023-07-19 20:14:430001InstantMesh:新AI框架可在10秒内从2D图像生成高质量3D网格
根据研究团队发表的预印本文章,InstantMesh是由腾讯PCGARC实验室和上海科技大学的研究人员开发的人工智能框架,能够在仅需10秒的时间内,从单个2D图像生成高质量的3D网格。站长网2024-04-29 17:14:550000亚马逊开始测试 Agility 的 Digit 机器人进行仓储工作
要点:1.亚马逊开始测试Agility的Digit机器人以用于仓储工作,这是亚马逊对新兴技术的投资的一部分。Digit是一种双足机器人,可以在仓库内进行各种搬运工作,具有广阔的应用前景。2.亚马逊还与麻省理工学院(MIT)合作,研究机器人对就业的影响,这反映了自动化和机器人技术对劳动力市场的潜在挑战。站长网2023-10-19 10:05:570000