MoA:用于图片合成的混合注意力架构 可实现风格参考和人物融合
站长网2024-04-22 09:59:320阅
划重点:
🔍 引入了一种新的架构,名为注意力混合模式(MoA),用于个性化文本到图像扩散模型。
🎨 MoA 通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。
🖼 MoA 能够生成高质量、个性化的图像,使得主题和背景的控制更加分离。
在最新的研究中,提出了一种名为注意力混合模式(MoA)的新架构,旨在个性化文本到图像扩散模型,可以实现风格参考和人物融合的效果。
受大型语言模型(LLMs)中使用的专家混合机制的启发,MoA 通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。具体来说,MoA 保留了原始模型的先验知识,通过固定先验分支中的注意力层,同时通过个性化分支最小干预生成过程,学习将主题嵌入由先验分支生成的布局和背景中。
一种新颖的路由机制管理着每个层中像素在这些分支之间的分布,以优化个性化和通用内容创建的混合。经过训练,MoA 能够轻松生成高质量的个性化图像,其主题和背景的组合和交互与原始模型生成的一样丰富多样。最重要的是,MoA 增强了模型的现有能力与新增个性化干预之间的区别,从而提供了一种之前无法实现的更为分离的主题 - 背景控制。
此外,研究还探讨了 MoA 在现实应用中的潜力。例如,结合 MoA 和 DDIM 反演技术,可以实现对真实图像中主体的替换;结合 MoA 和 ControlNet,可以实现带有姿势控制的个性化生成;MoA 甚至能够在面部和身体形状完全不同的情况下进行主体交换,以及轻松地在主体之间进行形态变换。这些应用展示了 MoA 在个性化图像生成领域的潜在价值和广泛适用性。
产品入口:https://top.aibase.com/tool/mixture-of-attention-moa-
0000
评论列表
共(0)条相关推荐
免费AI换脸网站Change Face 一键玩转动漫名人变脸
免费的AI换脸网站现已推出,这个网站可以让你将自己的脸和一些有趣的图像进行交换,比如名人、动漫、艺术、卡通等。只需上传一张清晰的正面照,然后选择想要换脸的图像或视频,就可以看到生成的效果。官网地址:https://top.aibase.com/tool/changeface-ai站长网2024-02-01 10:49:1200030估值数十亿,批量生产数字人!中国独角兽盯上直播电商
硅基智能创始人司马华鹏最近“写”了一本新书——《大模型时代:ChatGPT拉开硅基文明序幕》。确切地说,这本围绕人工智能、大模型、ChatGPT、数字人等领域展开讨论,前后洋洋洒洒数十万字的著作,是他与团队一起勾勒出框架和脉络,然后交给ChatGPT完成撰写的。甚至,AI还揽下了部分的销售工作。与DNA编码为核心的碳基生命相对应,以文本编码为核心的AI智能体为社会注入了新的硅基劳动力资源。站长网2023-09-10 08:38:490000苹果谷歌同天被巨额罚款!欧盟宣告重大胜利
快科技9月12日消息,当地时间9月10日,欧洲法院分别就苹果和谷歌的案件作出裁决,两家公司均告败诉。苹果公司被要求向爱尔兰补缴高达130亿欧元(约合1020亿元人民币)的税款,而谷歌则因市场垄断行为被处以24亿欧元(约合188亿元人民币)的罚款。主导这两起案件的欧盟反垄断负责人维斯塔格当天表示,这两项裁决是欧洲公民和税收公平的重大胜利。0000续航400里,新日新款电动车“幻影F9”亮相,颜值出挑,动力强劲
近些年,随着人们对电动车的需求量增大,各大企业研发出的产品也发生了日新月异的变化,不仅在外观上得到了改善,在品质方面也得有了提升。比如我们今天要分析的这款车型,新日新款电动车幻影f9,它的颜值出挑外观大气,有1200瓦强悍的输出动,关键是充满电可以跑出400里的续航,我们它的配置看看究竟如何?这款车型采用了简约的设计手法,引用了用f系车型外观设计灵感,使其更加有线条感。站长网2023-05-24 15:44:58000651岁的退休阿姨,在四线城市逐梦互联网
“他打了一个急方向,车就窜上树了。我在天上飞的时候,心里说完了完了,要去死了,不能死啊我还有好多事没做,闭着眼念了十声阿弥陀佛,车落在地上,我眼睛一睁,嘿,还活着。”大雨中的高速路旁,雪姨站在被撞烂的轿车前——这是她曾经努力销售的回报之一,后备箱里的保险单、宣传单在雨里飞,送客户的油洒了一地。眼前饭桌上没人夹菜,全被她的话抓住了视线:“那一刻我突然不想干保险了,哪怕去要饭都不再干了!”站长网2023-07-12 18:01:150000