免费试玩!商汤绘画大模型 RAPHAEL 出手即大作,击败 Stable Diffusion XL
站长网2023-07-14 00:35:461阅
商汤大模型团队提出的文生图大模型 RAPHAEL,可以生成具有高度艺术风格或者摄影风格的图片,速度极快。RAPHAEL 通过 Space-MoE、Time-MoE 和 Edge-supervised learning 三个组件实现。
论文地址:https://arxiv.org/pdf/2305.18295.pdf
Space-MoE 找出了文本中每一个 token 在图片中对应的区域,用不同的 expert 来处理不同的区域,最后融合;Time-MoE 使得模型能够在不同的 timestep 上选择不同的 expert,形成一系列的 diffusion path,用于绘画不同类别的名词、动词或形容词;Edge-supervised learning 模块使用物体的轮廓纹理来监督 attention 模块的学习。
RAPHAEL 在 FID 指标上击败了 Stable Diffusion 和 DALL-E2,同时在图文匹配度和生成质量上超过了其他模型。
RAPHAEL 在线试玩链接:https://miaohua.sensetime.com/zh-CN/
建议将步数调整到100以获得更佳的图片质量。
0001
评论列表
共(0)条相关推荐
三星电子 4 纳米工艺代工良率超过 75%:高通和英伟达外包生产可能性增加
三星电子最近将其4纳米工艺的工艺良率(良品率)提高至75%以上,引发人们猜测其可能会扩大半导体代工(合同制造)的主要客户。7月11日,HiInvestment&Securities研究员ParkSang-wook在一份晶圆报告中表示:「三星电子最近成功提高了4纳米工艺的产能。」并且「高通和英伟达通过三星电子晶圆再次外包生产的可能性增加了。」站长网2023-07-13 23:56:270000千万级热度!从全民跳“科目三”到AI重制经典影视IP,AI视频掀起创作热潮
最近这段时间,只要你还在网上冲浪,就肯定逃不过AI“魔改”视频的洗礼。只需一张图,无论是马斯克还是兵马俑,有生命的、没生命的通通跳起了网红热舞“科目三”。背后是阿里的AI“图生视频”技术搭载在通义千问新上线的“全民舞王”功能上,因为制作门槛足够低,引发无数网友跟风试玩,点燃了2024年AI视频的第一把火。去年11月份起,AI生成视频逐步成为各大公司、初创企业以及资本重点布局的热门赛道。站长网2024-01-19 09:13:170000PromptPerfect——专为大型语言模型设计的提示优化工具
PromptPerfect是一个AI提示词优化工具,旨在提升大型语言模型(LLM)和大型模型(LM)的性能。它支持优化各种AI模型的提示词,如ChatGPT、MidJourney、DALL-E2和StableDiffusion。通过PromptPerfect,用户可以轻松开发、调试和部署优化的提示词,以获得更准确、有趣和创新的AI生成内容。站长网2023-07-20 16:18:000000低于20万买不到!雷军回应小米SU7满街跑就是不卖:品质体验打磨好再上市
快科技1月25日消息,近段时间有不少人可能已经在街头见到了小米SU7,不过不少人吐槽,这声音雷军显然也听到了。有网友吐槽,小米SU7满大街跑就是不卖,这么多车满街跑的营销做的太6了,也太不厚道了。对此,雷军表示,SU7正在全国展开全面的路测,我们一定要把品质和体验打磨到足够好的阶段,再正式上市。站长网2024-01-25 20:55:310000科大讯飞与中国石化安徽石油分公司合作 探索行业大模型应用
11月22日,科大讯飞股份有限公司与中国石化销售股份有限公司安徽石油分公司在合肥签订战略合作协议。双方商定,将不断深化合作关系,共同探索构建行业大模型应用、加强信息化建设领域合作,为能源发展与高新技术的有机融合提供合适的土壤。站长网2023-11-23 08:24:110000