Doppelgangers：通过学习算法区分相似结构的图像

站长网2023-09-08 11:05:190阅

Doppelgangers是一个基于学习的方法来区分视觉上非常相似但是物理上是不同3D表面的图像对（我们称之为“庞氏图像”）。研究人员构建了一个包含大量正负样本的图像数据集Doppelgangers，其中正样本是同一实际3D表面拍摄的图片，负样本是不同但视觉上相似的3D表面。

论文地址:https://doppelgangers-3d.github.io/

研究人员设计了一个网络架构，利用局部特征点和匹配的空间分布作为输入，以便综合考虑局部和全局线索进行判断。实验结果表明，这种方法可以准确区分难以识别的负样本，并可集成到SfM流程中校正3D重建。

这种工具足够智能，可以避免人们可能会犯的错误。它的工作原理是根据3D 模型的特点，通过分析图片之间的微小差异，进而判断它们是否来自同一物体。

这一技术在许多领域都有潜在的应用价值，比如在艺术鉴赏、犯罪侦查、甚至是在日常生活中查找丢失的物品等。通过这种技术，我们可以更准确地分辨相似的图片，避免因误解而产生的问题。

本研究的主要创新和贡献包括:

1. 提出视觉消歧问题的定义，将其建模为图像对的二分类任务

2. 构建首个图像视觉消歧评估数据集Doppelgangers

3. 设计了一种网络架构，输入是对齐后的图像和关键点匹配mask， OUTPUT 是一对图像是否匹配的概率

4. 方法可以集成到SfM流程中，过滤错误匹配提高3D重建质量

本工作为处理视觉相似但实际不同的3D表面的图像提供了学习型解决方案，可广泛应用于3D重建、图像匹配等任务中。

Doppelgangers通过学习算法区分相似结构的图像

0000

评论列表

共(0)条

相关推荐

站长资讯
腾讯会议全面调整：逐步升级为免费版、专业版、商业版、企业版
快科技12月11日消息，腾讯会议官方近日发布了业务调整说明，宣布从2025年1月起逐步升级其服务模式为免费版、专业版、商业版与企业版。学生和公益人群将仍可享受特惠折扣，并额外提供教育版、教育加强版，供不同类型教育机构选择。免费版适用于个人移动办公需求，无可购高级账号。专业版适合个人及小型企业高速发展企业的需求，可购高级账号1-5个。
站长网2024-12-11 08:18:38
0000
站长资讯
抖音打击违规微短剧累计下架小程序内违规微短剧119部
抖音发布关于打击违规微短剧的公告称，近日，平台在日常巡查中发现，部分微短剧小程序含有不良价值观导向、低俗“擦边”等违规内容，部分账号涉及推广违规微短剧或大量发布同质化微短剧内容以博取流量。此类内容和行为严重破坏平台健康生态，平台将进一步规范微短剧类内容传播秩序，并持续治理违规内容。对此平台提出，微短剧及其推广内容、行为需符合以下要求:
站长网2023-11-16 11:41:48
0000
一位全网用户150万的独立开发者，又做了一款高评价AI搜索引擎
AI到底能不能颠覆搜索引擎，在搜索引擎里什么才是用户需要的革新功能?最近，一款看似没有任何壁垒的产品，给了我们一些新的视角。放弃AI加持，做最没有壁垒的搜索引擎一位即友的评价|图片来源:即刻，侵删
站长网站长资讯2024-12-10 09:23:47
0000
站长资讯
AI日报：谷歌发布开源语言模型Gemma2；讯飞星火V4炸场；Glif作者创建meme梗图生成器风靡推特
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、谷歌发布最强开源语言模型Gemma2性能超越Llama3
站长网2024-06-29 22:14:34
0000
站长资讯
AI生成视频，究竟有多癫狂?
最近，各路视频生成AI放出的Demo让人眼花缭乱。“容嬷嬷喂紫薇吃香肠”“唐僧啃鸡腿、吃汉堡”“尔康失态”等“名场面”在各大短视频平台广为流传。“刺激”的点在于，网友们无法预料一些经典的影视画面下一秒会衍生出什么剧情，也正因为如此，AI视频爆改在推出短短几周后，便迅速火遍了短视频平台。抖音上，相关话题“当AI扩图卷土重来”登上热榜，截至目前共有3.9亿次播放。
站长网2024-07-18 17:05:34
0000