免费试玩!商汤绘画大模型 RAPHAEL 出手即大作,击败 Stable Diffusion XL
站长网2023-07-14 00:35:462阅
商汤大模型团队提出的文生图大模型 RAPHAEL,可以生成具有高度艺术风格或者摄影风格的图片,速度极快。RAPHAEL 通过 Space-MoE、Time-MoE 和 Edge-supervised learning 三个组件实现。

论文地址:https://arxiv.org/pdf/2305.18295.pdf
Space-MoE 找出了文本中每一个 token 在图片中对应的区域,用不同的 expert 来处理不同的区域,最后融合;Time-MoE 使得模型能够在不同的 timestep 上选择不同的 expert,形成一系列的 diffusion path,用于绘画不同类别的名词、动词或形容词;Edge-supervised learning 模块使用物体的轮廓纹理来监督 attention 模块的学习。
RAPHAEL 在 FID 指标上击败了 Stable Diffusion 和 DALL-E2,同时在图文匹配度和生成质量上超过了其他模型。
RAPHAEL 在线试玩链接:https://miaohua.sensetime.com/zh-CN/
建议将步数调整到100以获得更佳的图片质量。
0002
评论列表
共(0)条相关推荐
淘宝卖家狂喜!AI产品摄影平台Pebblely一键即可生成完美产品图
Pebblely是一个AI产品摄影平台。只需上传常规图片,Pebblely会自动去除背景,并生成具有完美光线、反射和阴影的产品照片。用户只需点击一下按钮,Pebblely就能为产品生成多种风格迥异的照片。这些照片可用于电商网站、社交媒体推广,或者作为设计灵感的素材。体验地址:https://app.pebblely.com/站长网2023-09-01 18:01:550000中国AI大模型论文数量全球第一,清华力压麻省理工、斯坦福
论文是研究新技术、开发新产品获取“图纸”的重要途径之一,OpenAI的研究人员正是借鉴了Transformer的论文(被引用超过9万次),才开发出了对全球各行业影响巨大的产品ChatGPT。而论文的数量、通过率和被引用次数是衡量一个国家科技人才素质,以及技术创新能力的重要标准之一。站长网2024-07-08 15:25:370002高通展示在安卓设备上运行ControlNet 生成一张图仅需11.26秒
近日,高通在IEEE/CVF计算机视觉和模式识别年会上展示了在智能手机上运行生成式AI模型的进一步进展。站长网2023-06-26 23:41:290000美国监管机构将对微软、OpenAI和英伟达展开反垄断调查
据路透社报道,美国司法部和联邦贸易委员会(FTC)近日达成一项划分调查领域的协议,针对微软、OpenAI和英伟达在人工智能产业中的主导地位展开反垄断调查。消息人士透露,该协议预计将在未来几天内最终敲定。站长网2024-06-06 18:08:480000B站扶持月均平台收入不足5000元UP主:每月最高可获2000元激励
快科技3月18日消息,今日B站发布视频创作激励年度计划(2024版),重点关注暂无变现能力的UP主,作为基础激励的扶持对象。据悉,24年激励计划规则具体如下:1、重点关注暂无变现能力的UP主,作为基础激励的扶持对象。平台将在每月初根据UP主近半年收入水平,判断UP主当月是否享有基础激励,基础激励由内容质量、用户互动、更新频率等情况综合计算得出。站长网2024-03-18 22:58:280002