腾讯推加强版InstantID项目OMG:让ID身份保持从一人变多人
站长网2024-03-19 17:02:450阅
腾讯近日推出了一项名为OMG的新研究,这项研究支持在一张图片中生成多角色多概念。这是一个突破性的进展,因为以前的ID或概念保持项目只能将一个人还原在图片里面,而有了这个项目以后,就可以实现多人合照了。
项目地址:https://top.aibase.com/tool/omg
该项目还支持与原有的ID保持项目一起使用,比如Lora以及InstantID。这意味着,用户可以在一个项目中同时使用多个模型,无需进行额外的调整。这对于需要处理大量图像的研究人员和开发者来说,无疑是一个巨大的便利。
OMG的代码已经开源,这意味着所有的开发者都可以查看其插件实现。这无疑将进一步推动该领域的研究和发展。
OMG是一个为个性化生成设计的框架,它能友好地处理遮挡问题,能在一幅图像中无缝集成多种概念。这个框架包含两个阶段:第一阶段专注于图像布局的生成和为处理遮挡而收集视觉理解信息;第二阶段则利用这些视觉理解信息,并结合精心设计的噪声混合技术,将多个概念融合在一起,同时考虑遮挡因素。
在噪声混合过程中,选择合适的开始去噪时间点对于保持人物身份和图像布局至关重要。这一点的发现,无疑将为未来的研究提供重要的参考。
此外,OMG还能与多种单概念生成模型兼容,如LoRA和InstantID。尤其值得一提的是,LoRA模型可以直接从这个网址获取并使用。这无疑将进一步推动该领域的研究和发展。
总的来说,腾讯的这项新研究,不仅为我们提供了一个全新的视角来处理图像生成问题,也为未来的研究提供了重要的参考。我们期待看到更多的研究成果在这个领域出现。
0000
评论列表
共(0)条相关推荐
老匡:3个AI新玩法,引流+成交,实操,速看!
这段时间,我们在视频号、小红书等平台,又发现了几个利用AI引流或做小生意的新玩法,本文3个案例,就最近这两个月刚出来,可以说新鲜出炉,附详细操作步骤,供大家参考,觉得不错,转发支持一把,感谢!1、“AI预测胎儿长相”引流宝妈粉2、“AI老人祝福号”卖中老年产品3、淘宝卖“AI防封二维码”服务01“AI预测胎儿长相”引流宝妈粉站长网2023-08-15 13:54:010004我在小红书接演唱会约妆:日赚300,越来越卷
今年最火爆的线下顶流,非演唱会莫属。每逢周末,大概率就会在朋友圈刷到坐标不同城市的演唱会晒图或视频分享,更有注重仪式感的年轻人搭配好专门的妆容造型,力争在现场拍出最亮眼的打卡照。在这其中,丝带编发星星夹脸部贴钻/彩绘的组合几乎成为标配,这样的打扮在生活中可能不够日常,但十分契合演唱会热烈的现场氛围。只不过,并不是所有人都擅长这样神奇的“换头术”,演唱会约妆这门小生意应运而生。站长网2023-09-22 21:22:010000开源聊天机器人框架Lobe Chat 支持语音合成、多模态等多种功能
要点:1.LobeChat是一个高性能、开源的聊天机器人框架,支持语音合成、多模态和可扩展的插件系统,能一键自由部署私有ChatGPT/LLMWeb应用。2.新增特性包括对gpt-4-vision模型的视觉支持,支持文本转语音(TTS)和语音转文本(STT)技术,以及一个功能调用插件系统,为ChatGPT提供实时信息检索和处理的能力。站长网2023-12-15 18:03:400002在线设计工具灵动AI 轻松打造电商产品图
灵动AI,一款卓越的在线设计工具,利用先进的人工智能技术,迅速打造专业品质的商品图。这个创新性的工具提供了丰富多样的模板和素材,广泛适用于美妆、快消品、3C数码、家电、家装等各种产品品类。用户只需上传自家商品图片,选择心仪的场景模板,即可轻松生成高质量的商品场景图。而灵动AI不仅支持输出电商主图、电商海报,还能生成商品视频等多样化的营销物料,适应各种用途的需求。站长网2023-11-24 16:55:240000