Doppelgangers:通过学习算法区分相似结构的图像
站长网2023-09-08 11:05:190阅
Doppelgangers是一个基于学习的方法来区分视觉上非常相似但是物理上是不同3D表面的图像对(我们称之为“庞氏图像”)。研究人员构建了一个包含大量正负样本的图像数据集Doppelgangers,其中正样本是同一实际3D表面拍摄的图片,负样本是不同但视觉上相似的3D表面。
论文地址:https://doppelgangers-3d.github.io/
研究人员设计了一个网络架构,利用局部特征点和匹配的空间分布作为输入,以便综合考虑局部和全局线索进行判断。实验结果表明,这种方法可以准确区分难以识别的负样本,并可集成到SfM流程中校正3D重建。
这种工具足够智能,可以避免人们可能会犯的错误。它的工作原理是根据3D 模型的特点,通过分析图片之间的微小差异,进而判断它们是否来自同一物体。
这一技术在许多领域都有潜在的应用价值,比如在艺术鉴赏、犯罪侦查、甚至是在日常生活中查找丢失的物品等。通过这种技术,我们可以更准确地分辨相似的图片,避免因误解而产生的问题。
本研究的主要创新和贡献包括:
1. 提出视觉消歧问题的定义,将其建模为图像对的二分类任务
2. 构建首个图像视觉消歧评估数据集Doppelgangers
3. 设计了一种网络架构,输入是对齐后的图像和关键点匹配mask, OUTPUT 是一对图像是否匹配的概率
4. 方法可以集成到SfM流程中,过滤错误匹配提高3D重建质量
本工作为处理视觉相似但实际不同的3D表面的图像提供了学习型解决方案,可广泛应用于3D重建、图像匹配等任务中。
0000
评论列表
共(0)条相关推荐
韩国 2025 年起将 AI 引入中小学课程 解决教育不平等问题
韩国教育部日前表示,为满足对多样化学习内容日益增长的需求,将从2025年开始在中小学引入人工智能(AI)数字教科书。站长网2023-06-12 03:42:430000著名物理学家将人工智能聊天机器人称为「美化的录音机」
著名理论物理学家MichioKaku表示,公众对新的人工智能技术的焦虑是错误的。在周日接受CNN的FareedZakaria采访时,这位未来学家表示,OpenAI的ChatGPT等聊天机器人将有益于社会,并提高生产力。但恐惧驱使人们主要关注这些程序的负面影响,他称其为「被美化的录音机」。站长网2023-08-14 09:47:520000AIwechat-Vercel:无需服务器即可将AI功能集成到公众号中
AIwechat-Vercel是一款创新的微信公众号插件,它利用Vercel的ServerlessFunctions提供后端服务,使得用户无需自己管理服务器,只需一个可以绑定到Vercel的域名(无需备案),即可实现将AI功能集成到微信公众号中。项目地址:https://github.com/pwh-pwh/aiwechat-vercel站长网2024-03-11 12:03:270000大模型故事,科大讯飞还没讲透
时值科大讯飞的多事之秋,压下重注的AI大模型前路几何,还未见分晓。8月11日晚间,科大讯飞发布了2023年半年报。财报显示,公司上半年实现营业收入78.42亿元,同比下降2.26%,归母净利润为0.74亿元,同比下降73.54%,扣除非经常性损益的净亏损为3.04亿元,同比下降208.99%。站长网2023-08-17 09:38:300000雷军:小米澎湃OS底层全面重构 AI赋能整个生态
刚刚,雷军披露了更多有关小米澎湃OS的相关信息。雷军表示,小米澎湃OS是一个超级庞大的工程体系。从架构设计之初,就明确了四个目标:第一,实现单端性能表现最强;第二,AI赋能,成为整个生态的“智能大脑”,能够为用户提供主动服务;第三,更加便捷高效的连接;第四,实现全端隐私安全坚固防护。站长网2023-10-24 21:20:390000