登陆注册
20091

腾讯推加强版InstantID项目OMG:让ID身份保持从一人变多人

站长网2024-03-19 17:02:450

腾讯近日推出了一项名为OMG的新研究,这项研究支持在一张图片中生成多角色多概念。这是一个突破性的进展,因为以前的ID或概念保持项目只能将一个人还原在图片里面,而有了这个项目以后,就可以实现多人合照了。

项目地址:https://top.aibase.com/tool/omg

该项目还支持与原有的ID保持项目一起使用,比如Lora以及InstantID。这意味着,用户可以在一个项目中同时使用多个模型,无需进行额外的调整。这对于需要处理大量图像的研究人员和开发者来说,无疑是一个巨大的便利。

OMG的代码已经开源,这意味着所有的开发者都可以查看其插件实现。这无疑将进一步推动该领域的研究和发展。

OMG是一个为个性化生成设计的框架,它能友好地处理遮挡问题,能在一幅图像中无缝集成多种概念。这个框架包含两个阶段:第一阶段专注于图像布局的生成和为处理遮挡而收集视觉理解信息;第二阶段则利用这些视觉理解信息,并结合精心设计的噪声混合技术,将多个概念融合在一起,同时考虑遮挡因素。

在噪声混合过程中,选择合适的开始去噪时间点对于保持人物身份和图像布局至关重要。这一点的发现,无疑将为未来的研究提供重要的参考。

此外,OMG还能与多种单概念生成模型兼容,如LoRA和InstantID。尤其值得一提的是,LoRA模型可以直接从这个网址获取并使用。这无疑将进一步推动该领域的研究和发展。

总的来说,腾讯的这项新研究,不仅为我们提供了一个全新的视角来处理图像生成问题,也为未来的研究提供了重要的参考。我们期待看到更多的研究成果在这个领域出现。

0000
评论列表
共(0)条