腾讯推加强版InstantID项目OMG:让ID身份保持从一人变多人
站长网2024-03-19 17:02:450阅
腾讯近日推出了一项名为OMG的新研究,这项研究支持在一张图片中生成多角色多概念。这是一个突破性的进展,因为以前的ID或概念保持项目只能将一个人还原在图片里面,而有了这个项目以后,就可以实现多人合照了。
项目地址:https://top.aibase.com/tool/omg
该项目还支持与原有的ID保持项目一起使用,比如Lora以及InstantID。这意味着,用户可以在一个项目中同时使用多个模型,无需进行额外的调整。这对于需要处理大量图像的研究人员和开发者来说,无疑是一个巨大的便利。
OMG的代码已经开源,这意味着所有的开发者都可以查看其插件实现。这无疑将进一步推动该领域的研究和发展。
OMG是一个为个性化生成设计的框架,它能友好地处理遮挡问题,能在一幅图像中无缝集成多种概念。这个框架包含两个阶段:第一阶段专注于图像布局的生成和为处理遮挡而收集视觉理解信息;第二阶段则利用这些视觉理解信息,并结合精心设计的噪声混合技术,将多个概念融合在一起,同时考虑遮挡因素。
在噪声混合过程中,选择合适的开始去噪时间点对于保持人物身份和图像布局至关重要。这一点的发现,无疑将为未来的研究提供重要的参考。
此外,OMG还能与多种单概念生成模型兼容,如LoRA和InstantID。尤其值得一提的是,LoRA模型可以直接从这个网址获取并使用。这无疑将进一步推动该领域的研究和发展。
总的来说,腾讯的这项新研究,不仅为我们提供了一个全新的视角来处理图像生成问题,也为未来的研究提供了重要的参考。我们期待看到更多的研究成果在这个领域出现。
0000
评论列表
共(0)条相关推荐
开源版「ChatGPT Plus」来了,能做数据分析、插件调用、自动上网,落地真实世界的智能体
OpenAIChatGPTPlus订阅付费功能强大,可以实现高阶「数据分析」(AdvancedDataAnalysis)、「插件调用」(Plugins)以及「自动网页浏览」(BrowsewithBing),能够作为日常生活中的重要生产力工具。可是因为商业原因而选择了闭源,研究者和开发者也只能使用而没有办法在其上面做任何的研究或改进。站长网2023-10-25 19:48:330000快手开展“直播乱象”专项治理 整治卖惨、恶俗pk等问题
站长之家(ChinaZ.com)5月25日消息:昨日,快手发布《关于开展直播乱象专项治理的公告》称,即日起快手开展“直播乱象”专项整治行动。专项期间紧盯平台重点流量环节,严肃整治直播间网络乞讨、低俗软色情、恶俗pk、色情导流、低俗演绎、蹭热炒作、专业领域主播无资质(医疗、证券、法律)、借未成年和老年人卖惨直播等系列突出问题,从严、从重处置违规账号,并阶段性公示整治行动进展。站长网2023-05-25 08:55:010000百度百家号上线「百家号 AI 助手」功能 可一键生成热点文章
今日,百度百家号宣布基于百度AI大模型上线「百家号AI助手」功能,创作者可体验基于热点内容一键生成优质文章的玩法,可登录百家号PC后台首页进行体验。以下为具体功能介绍:站长网2023-09-20 15:33:070004AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/📰🤖📢AI新鲜事OpenAI公布Sora技术报告:模拟世界、视频扩展等,强的离谱!【AiBase提要:】⭐️Sora可以模拟物理世界中的人、动物和环境站长网2024-02-18 16:02:290000京瓷改变战略退出消费类手机业务 继续面向企业客户
据日经新闻的一份报道,京瓷(Kyocera)宣布将退出消费者智能手机业务。该公司在公布财年财务业绩的电话会议上宣布了这一决定。京瓷总裁谷本英夫表示,公司决定退出消费者智能手机业务是因为缺乏利润。站长网2023-05-16 17:45:560000