免费试玩!商汤绘画大模型 RAPHAEL 出手即大作,击败 Stable Diffusion XL
站长网2023-07-14 00:35:461阅
商汤大模型团队提出的文生图大模型 RAPHAEL,可以生成具有高度艺术风格或者摄影风格的图片,速度极快。RAPHAEL 通过 Space-MoE、Time-MoE 和 Edge-supervised learning 三个组件实现。
论文地址:https://arxiv.org/pdf/2305.18295.pdf
Space-MoE 找出了文本中每一个 token 在图片中对应的区域,用不同的 expert 来处理不同的区域,最后融合;Time-MoE 使得模型能够在不同的 timestep 上选择不同的 expert,形成一系列的 diffusion path,用于绘画不同类别的名词、动词或形容词;Edge-supervised learning 模块使用物体的轮廓纹理来监督 attention 模块的学习。
RAPHAEL 在 FID 指标上击败了 Stable Diffusion 和 DALL-E2,同时在图文匹配度和生成质量上超过了其他模型。
RAPHAEL 在线试玩链接:https://miaohua.sensetime.com/zh-CN/
建议将步数调整到100以获得更佳的图片质量。
0001
评论列表
共(0)条相关推荐
对话王小川:大语言模型是起点,AGI时代已经到来
中国的互联网圈,科技圈的少有这么热闹的时候。上周,王小川在搜狐网络大厦召开了一场发布会,重点讲了一件事:我,王小川要加入中国大模型创业大军。为什么说是创业大军呢?因为就在发布会楼上的办公区,美团联合创始人王慧文也在此开启了大模型创业项目“光年之外”。除了他们之外,还有其他不少创业者们都涌进了大模型创业赛道。站长网2023-04-18 13:55:530000QQ第四季度生态治理报告:封停60万个QQ群、429万个QQ号
腾讯QQ安全中心近日公布了2023年第四季度的QQ平台生态治理报告。报告显示,QQ平台在2023年第四季度针对违规内容进行了大力整治,共计对60万个QQ群和429万个QQ账号进行了封停处理。这些被封停的账号和群组主要涉及色情低俗、虚假宣传、不良导向内容以及饭圈水军等违规活动。QQ平台通过专项行动,深化治理,严厉打击这些违规行为。站长网2024-02-07 15:14:570000必应聊天Bing Chat每轮会话已最多支持30次交流
据微软官方宣布,必应聊天(BingChat)的限制已经进一步放宽,每轮会话最多支持30次交流,而且用户每天最多可进行300次聊天交流。微软推出的必应聊天(BingChat)是一款基于人工智能的搜索引擎聊天模式,用户可以通过自然语言与必应搜索交流,获取信息、娱乐和创意内容。必应聊天的目标是为用户提供更加人性化、有趣和高效的搜索体验。站长网2023-06-03 09:19:420000谷歌文生图巅峰之作Imagen 2登场,实测暴打DALL·E 3和Midjourney!
【新智元导读】卷疯了卷疯了,谷歌刚刚放出了文生图AI模型的巅峰之作Imagen2,实测效果逼真细腻,生成的美女图仿佛真人照片,对于提示的还原程度已经打败了DALL·E3和Midjourney!最强文生图大模型这是要易主了?提问:下面这张图,是AI生图还是照片?如果不是这么问,绝大多数人大概都不会想到,这居然不是一张照片。是的,只要在谷歌最新AI生图神器Imagen2中输入这样的提示词——站长网2023-12-14 14:52:480002小米:已捐献“UltraSpace 存储扩容” 相信友商会跟进
上周,小米14正式发布,除了常规硬件升级外,雷军还宣布了一项重磅功能,即澎湃OS配合存储实现的存储扩容。小米将原本256GB的存储容量提升到了264GB(256GB8GB),而原本512GB的存储容量更是提升到了528GB(512GB16GB)。这种扩容方式不仅增加了用户的使用空间,而且完全不会对UFS造成寿命风险。站长网2023-10-30 13:53:140001