免费试玩!商汤绘画大模型 RAPHAEL 出手即大作,击败 Stable Diffusion XL
站长网2023-07-14 00:35:462阅
商汤大模型团队提出的文生图大模型 RAPHAEL,可以生成具有高度艺术风格或者摄影风格的图片,速度极快。RAPHAEL 通过 Space-MoE、Time-MoE 和 Edge-supervised learning 三个组件实现。

论文地址:https://arxiv.org/pdf/2305.18295.pdf
Space-MoE 找出了文本中每一个 token 在图片中对应的区域,用不同的 expert 来处理不同的区域,最后融合;Time-MoE 使得模型能够在不同的 timestep 上选择不同的 expert,形成一系列的 diffusion path,用于绘画不同类别的名词、动词或形容词;Edge-supervised learning 模块使用物体的轮廓纹理来监督 attention 模块的学习。
RAPHAEL 在 FID 指标上击败了 Stable Diffusion 和 DALL-E2,同时在图文匹配度和生成质量上超过了其他模型。
RAPHAEL 在线试玩链接:https://miaohua.sensetime.com/zh-CN/
建议将步数调整到100以获得更佳的图片质量。
0002
评论列表
共(0)条相关推荐
品牌直播2023:内卷与突围
回顾2023年,红利消退、降本增效成为越来越多品牌的共识,相较几年前找大主播带货的“轻松”,品牌们不得不走出舒适区,或大搞内容,或开启撒钱模式,或探索新平台新玩法,期待能真正积累起属于自己的企业数字化内容资产。多番尝试下,有人为活力28的“三个小老头”疯狂下单,有人为椰树的荷尔蒙直播频频点赞,有人因为79元眉笔事件开始重新思考品牌的营销动作……站长网2024-01-04 14:23:540002AI前哨|“AI翻车事故”十年暴涨15倍 这三巨头成为“罪魁祸首”
凤凰网科技讯《AI前哨》北京时间6月29日消息,网络安全公司Surfshark发布的报告显示,随着人工智能(AI)的快速发展,AI的“翻车事故”(AIincident)数量在十年时间内(按阶段)增长了15倍,三家主要AI公司占据了其中的四分之一。站长网2023-06-29 15:45:540001中国小女孩向马斯克报BUG成功 回应:将修复
站长之家(ChinaZ.com)7月2日消息:昨日,年仅7岁的中国小女孩茉莉(Molly),以她纯真的声音和勇敢的行动,向全球科技巨头特斯拉的创始人埃隆·马斯克发起了一场“隔空对话”。她不仅用英语清晰地描述了自己在特斯拉汽车中遇到的一个小“烦恼”,还勇敢地请求马斯克能够帮忙解决这一技术问题。站长网2024-07-02 15:31:260000三星正在测试将ChatGPT集成到其移动浏览器中
三星一直在寻找将AI引入其智能手机的方法。此前有报道提到三星如何引起谷歌的恐慌,仅仅是因为它希望从谷歌搜索切换到MicrosoftBing的人工智能功能。后来,三星放弃了这个想法,坚持使用谷歌搜索。据TechNewsSpace报道,三星正在测试将ChatGPT集成到其移动浏览器中。目前,三星互联网浏览器中没有与ChatGPT相关的功能。站长网2023-07-15 11:18:540000林俊杰认栽,第一波元宇宙炒房团“覆灭”
曾经热炒的元宇宙地产“哑火”了。元宇宙分析平台WeMeta数据显示,2021年11月,歌手林俊杰花12.3万美元在Decentraland购买的3块虚拟地产,目前价值已经跌到约1万美元,浮亏91%。林俊杰在微博上晒出“空钱包”的图片,自我调侃:“听说最近很多人想帮我理财?”站长网2023-04-19 15:45:350000