斯坦福大学研究生开发名为PIGEON的AI模型 仅通过几张照片找到你的位置
划重点:
- 研究生们在斯坦福大学开发出一款 AI 模型,可以通过查看 Google 街景图像,以令人印象深刻的准确率确定具体位置。
- 这款名为 PIGEON 的应用程序可以在很大程度上准确地确定 Google 街景中的具体位置,其预测国家的准确率达到92%,并且在40%的猜测中可以将位置定位在目标位置的25公里范围内。
- 该模型基于 OpenAI 开发的神经网络 CLIP,以及 GeoGuessr 游戏的数据集进行训练,取得了令人印象深刻的成果。
斯坦福大学的研究生们开发了一款名为 PIGEON 的应用程序,可以仅仅通过查看 Google 街景图像或其他图像来确定具体位置,其准确率令人印象深刻。
根据预印本论文的数据,PIGEON 可以以92%的准确率预测所拍摄国家,并且在40%的猜测中可以将位置定位在目标位置的25公里范围内。该论文指出,PIGEON 在 GeoGuessr 游戏中排名前0.01%的玩家之内,该游戏要求用户根据所拍摄的 Google 街景图像猜测位置,这也是这个项目的灵感来源。
那么,PIGEON 是如何工作的呢?
学生们利用了 OpenAI 开发的神经网络 CLIP,通过对视觉类别名称进行训练,使其能够将文本和图像进行连接。然后,他们根据 GeoGuessr 的数据集进行了训练,该数据集包含了10万个原始随机采样的地点和四张图像,以覆盖给定位置的整个 “全景”,总共有40万张图像。与其他 AI 模型训练的图像数量相比,PIGEON 的训练图像数量相对较少。例如,OpenAI 流行的图像生成模型 DALL-E2是基于数亿张图像进行训练的。
此外,学生们还研发了一个名为 PIGEOTTO 的单独模型,该模型通过训练来自 Flickr 和维基百科的400万张照片,以从单张图像中识别位置。根据论文的数据,PIGEOTTO 在图像地理定位基准测试中取得了令人印象深刻的成绩,在城市准确度方面超过先前的最新技术结果7.7%,在国家准确度方面超过29.8%。
论文还探讨了与该模型相关的伦理考虑,包括其益处和风险。在一方面,图像地理定位具有许多积极的用途,例如自动驾驶、视觉调查以及满足对照片拍摄地点的好奇心。然而,其负面影响包括对隐私的最直接侵犯。因此,学生们决定不公开发布模型权重,仅在学术验证时发布代码。
这项研究为我们展示了 AI 在图像地理定位方面的巨大潜力,但也引发了隐私和伦理方面的一些担忧。在将来的发展中,必须更加重视这些问题,并确保合适的保护措施得以实施。
论文网址:https://arxiv.org/abs/2307.05845
?签约OR孵化,MCN机构该如何平衡商业效率?
在刚刚过去的4月,由克劳锐出品的《2023中国内容机构(MCN)行业发展研究白皮书》重磅发布,白皮书在引发业内热议的同时也为中国MCN机构的发展给出了可能的方向。在白皮书发布后,克劳锐以“实现增长,路在何方”为主题发起系列直播,通过对话MCN机构创始人,探讨MCN机构们当前关注的重点行业问题。0000CopyCopter:一键将文章转为短视频 自动配乐并加字幕
在当今快速发展的数字化世界中,社交媒体的影响力日益增强。然而,创建引人入胜的社交媒体内容常常需要消耗大量时间和精力。为此,一款名为CopyCopter的强大AI工具应运而生,它能够将长篇内容转化为引人入胜的社交媒体片段,为您的内容分发节省时间并扩大影响力。站长网2024-03-05 13:16:140000台积电5月销售额飙升30% AI需求成主要驱动力
站长之家(ChinaZ.com)6月7日消息:据外媒报道,台积电在5月份的销售额实现了显著增长,达到了2296亿新台币(约合71亿美元),同比增长30%。这一增长主要得益于人工智能需求的激增以及部分消费电子产品的复苏。站长网2024-06-08 09:51:490000全球运用游戏科技参与申遗,“数字中轴·小宇宙”上线
站长之家(ChinaZ.com)7月28日消息:2024年7月27日,在印度新德里召开的第46届世界遗产大会上,北京中轴线被正式列入《世界遗产名录》。同日,作为全球首次运用游戏科技参与申遗的重要创新成果,“数字中轴·小宇宙”沉浸互动产品正式上线。站长网2024-07-30 08:43:400000京东重新定义9.9元包邮
3袋东北兴凯湖的500克装云露香米,3斤装的四川软籽石榴,16卷5层加厚的漫花无芯卷纸,这些平时至少十几元、几十元的日用产品,现在只要9.9元就能包邮到家。如果你身边还有几个购物搭子,那么你和你的搭子们还能以9.9元的价格买到平时40多块的20枚无抗鲜鸡蛋,以89元的价格买到平时上百元的飞利浦(PHILIPS)电动牙刷……站长网2024-09-12 02:31:530000