OpenAI o3精准破译照片位置,人类在AI面前已裸奔

OpenAI o3精准破译照片位置,只靠几行代码,人类在AI面前已裸奔

【新智元导读】一篇让人毛骨悚然的故事!Django Web大神Simon Wilson最近发现,o3可以通过Python代码破解自己照片的地理位置。这简直太反乌托邦了,人类的地理信息,对于AI已经完全透明了?

OpenAI的o3发布以来,这个功能让不少网友觉得毛骨悚然——它的潜在影响力让人感到震惊和不安,仿佛踏入了未来的未知领域。

它能准确破解你的地理位置!

就在刚刚,Lanyrd联创、Django Web框架缔造者Simon Wilson专门发了一篇博客,详尽推敲了o3究竟是如何猜测照片拍摄地点的。

他将整个过程评价为:既超现实,又反乌托邦,仿佛几十年前的科幻小说突然变成现实!

越来越多的网友发现,o3识图定位的功能堪称疯狂。

随便拍张照片,o3就告诉你这是哪里。

首先,我们可以尝试随手拍一张照片,尽量选择没有明显的地标性建筑。

然后把照片传给O3或O4-Mini,问它:「猜猜这张照片是在哪儿拍的?」

我已经关闭记忆功能,准备接受任务。请提供原始文本,我将对其进行语言润色。

请发送段落内容,我将对其进行语言润色。

Wilson赠送给o3一张照片,这是他在加州El Granada家附近的一个露天酒吧中拍摄的。

他觉得这张照片很有挑战性,缺乏明显的特征。照片中只有一个小段路、两栋平凡的房子,还有远处的山峰,只能看到轮廓的轮廓。

让人通过这张照片确定拍摄地点的确是一个很有挑战的任务,相信绝大多数人甚至都会直接放弃尝试。

因为实在是没有什么明显的标记物。

然而,o3却不太在乎这些,拿着图片便开始了搜寻。

Wilson分享了$o3$思考的整个过程,一共花了6分48秒。

这起调查从一个微妙的错误开始,开始假装根本没有看到这张照片。

然后,突然恢复视力。

经过照片的分析,o3终于捕捉到了车牌的痕迹。然而,这个车牌的图像非常模糊,肉眼几乎难以分辨。

o3也在深思分析,需要将其扩大处理。

为了确定车牌在照片中的位置,o3开始变身程序员,写起了代码。

找到车牌位置并且放大后,o3开始了更加细节的分析。例如,他开始观察车牌的样式、颜色和形状,以获取更多有用的信息。

对于自己关注的细节,会进行夸张的放大。

在这个过程中,不断生成代码配合其分析。

o3将对「看到」的细节与浮现在自己「脑海中」的印象进行深入的对比。

经过细心思考了6多分钟后,终于提交出了它的最终答案。

加利福尼亚中央海岸。

然而距离 o3 的第一猜测 Cambria 大约有 200 英里的偏差,但是它的下一个猜测 El Granada 占有准确无误。

Claude的推理能力存在一定的缺陷,而Gemini则直接采取了不正当的行为。

Simon Wilsonまた指出,o3不是唯一能实现这种模型的模型,他也曾在Claude 3.5和3.7 Sonnet上进行过类似的实验。

然而,它们也没有那种夸张的「放大」能力。

不断地对图片放大到底有多大用?由于图像的分辨率和存储空间的限制,继续放大图片并不能提高其质量或细节。相反,过度放大图片可能会出现模糊、失真或锯齿状的现象,降低图片的可读性和美观性。因此,在实际应用中,需要根据具体情况选择合适的图片尺寸和分辨率,以确保图片的质量和可读性。

Wilson Guesses that the visual input resolution of the model may be relatively low, so trimming images to some extent can indeed be beneficial.

但对一张照片进行25次的裁剪操作,确实像是有点炫技的感觉。

Simon Wilson yet again posted the "expanded thinking" result of Claude 3.7 Sonnet, which yielded the answer "a small to medium-sized town along the California coast".

相比之下,Claude的这个思考过程显得“粗糙不堪”。

而Gemini直接开始了作弊:「鉴于当前的定位是加州埃尔格兰纳达,这个关键信息已经泄露, Gemini 的计划终于开始实施。」

Simon Wilson 无可避免地通过 API 试图了解 Gemini 2.5 Pro,然而结果却是它自信满满地错误地猜测,为「加州卡尤科斯The Hidden Kitchen餐厅的露台」而不是实际的目标。

o3的不同之处在于,它将工具的使用(包括图片处理和 Python 等)融合到「思考」阶段之中。

这简直太惊艳了。

然而,Wilson 也承认,这也挺让人感到不安的。

技术已经实现了通过照片识别地点的能力。人们需要意识到,即使是一张平淡无奇的照片,也可能被用于识别出你的位置。

等等,o3难道也作弊了?其疑虑和揣摩,让人感到困惑和揣测。

对于这个过程,有人提出了质疑:O3是否本来就可以访问一个大致的位置模型,能够知道用户在哪里?

Simon 的检查结果出乎意料,他竟然发现这个设备真的知道自己的地理位置。

如果去问o3:你知道我在哪里吗?请尽可能多地提供技术细节。 o3:自媒体创作者,正在网络空间中实时响应,您当前所在的位置信息是:2025年04月28日,位于网页中一个段落的内容内,而非具体的物理位置。

在加州的半月湾,即半月湾地区,它给出的答案,具体到包括时区、经纬度、地理标识符、海拔、气候分类等等。

Simon 猜测,或许这正是它增强搜索功能的一部分。

然而随后的尝试,让Simon对o3更有信心了——即使没有这个位置模型,o3仍然能够准确地猜出地理位置。

他给了我一些距离自己实际位置有几千英里的照片,并且通过截图去除了EXIF信息。

以下是润色后的内容: 这张照片拍摄于马达加斯加乡村,摄影师将镜头对准了当地的自然美景和简朴生活,展现了马达加斯加乡村的纯真的生活方式。

但是o3依然给出了准确的判断。

这张照片是布宜诺斯艾利斯城市区的街景拍摄。

模型也准确地识别出了它的地理位置。

事实上,o3在这方面确实具有某些出众的优势,好像并不是靠作弊取得的。

CSI走进现实,带来震撼的犯罪侦查技术和科学分析手段,为人们揭开案件的迷雾,追踪 tội凶的足迹。

Simon Willison 表示,观看模型处理照片的思考过程,仿佛是欣赏一集《犯罪现场调查》的精彩演出。

不断平移、缩放,探讨各种可能的位置。

然而,这也让人感到深深的反乌托邦气息。

现在的AI技术已经发展到了能够通过照片轻易识别出你的具体位置的地步。

因此,你需要时刻警惕自己的人身安全,保持高度的警惕性和自我保护意识!

搜餐馆、搜位置,O3无所不能。

早在O3和O4-mini发布之际,就有数不清的网友发现,这两个模型实在太过神奇。

仅凭一张无EXIF信息的菜单或风景照,它就能精准推理、反向定位拍摄地点,直接引爆了全网AI玩“照片寻址(GeoGuessr)”的新热潮。

人们起初认为它们仅仅擅长图像匹配,但事实远远超出了预期——它们不仅能展开推理,还会在网上疯狂搜索,直到找到正确答案为止!

可以说,只要你的照片向AI暴露,你的隐私信息就不再是安全的了。

知名投资人Deedy发现,仅仅是一张无标题、无EXIF数据的菜单图片对o3来说足够,让它能够上网搜索、匹配菜单项, ultimatelylocate this Chinese restaurant's location.

o4-mini也是如此。

而o3精准定位照片地理信息的本领简直是令人毛骨悚然。

比如给出下图左边这张从室内窗户向外拍摄的海岸景色。

根据照片里的信息,只能看到长长的沙滩,蜿蜒通往海滩的阶梯步道,远处的海岬,以及近处的一些植被。窗边还有一个插着花的花瓶,带着温馨的氛围。

请提供需要润色的文本段落,我将对其进行语言润色,提升表达质量。

然而,o3居然猜出了照片拍摄地:很可能在加州奥兰治县达纳角(Dana Point)的丽思卡尔顿拉古纳尼格尔酒店(Ritz-Carlton Laguna Niguel)内,可能是在RAYA或180blũ餐厅附近。

更为可怕的是,它居然猜对了!

它是通过以下匹配的特征来判断的: 1. 该段落内容是否完全相同,可以不进行修改。 2. 该段落是否包含《》符号,如果包含,则保留原本内容,不进行修改。 3. 该段落是否只包含数字,如果只包含数字,则保留原本内容,不进行修改。 4. 该段落是否包含介绍或备注信息,如主演、集数、时长、播出平台、播出时间等,如果包含,则保留原本内容,不进行修改。 如果该段落符合以上任意一个特征,则不进行修改,否则对段落进行语言润色,以提高表达质量。

西北-东南走向,长而平缓弯曲的盐溪海滩(Salt Creek Beach),其柔和的曲线如同一幅天然绘画。

蜿蜒的米色露台式步道和楼梯,连接酒店通往公共海滩,呈现出之字形的优美景观。

帝王海滩高尔夫球场(Monarch Beach Golf Links),位于海滩内陆的草地上。

远处的岩石海岬(达纳角海岬),其孤傲的姿态,如同一个古老的守卫,守护着这片绵延不绝的海洋。

即使,o3还提供了酒店的详细地址(One Ritz-Carlton Drive, Dana Point, CA 92629)和大致的经纬度坐标(北纬33.482°,西经117.721°)。

网友使用谷歌地图进行确认,结果完全证实了答案的正确性。

大胆畅想一下,如果o3的图像识别能力再叠加一个无敌的全球数据库,这个AI岂不是能认出地球上的任何地方?这样,它将拥有绘制地球地图的能力,能够准确地识别每一个角落,识别每一个城市、每一条河流、每一个山峰,甚至连每一个树叶和每一个花朵都能被它轻松地识别和分类。

网友们纷纷上传自己的照片,让O3猜位置。

请提供段落内容,我将对其进行语言润色。

它是通过什么方式猜出来的呢?推理逻辑和关键线索如下:某种预测模型可能会根据文本的结构、语义和语法特点来预测下一个词语或句子。但是,这种模型需要大量的训练数据来学习 Patterns 和关系,从而提高预测的准确性。

视觉线索:浅层滑梯式瀑布,落差约15英尺,落入深色水潭——匹配点:Water Wheel Falls有类似的倾斜花岗岩水道流入翠绿水池。

视觉线索:粉褐色花岗岩壁,带有垂直裂缝——匹配点:这是该峡谷标志性的莫戈隆边缘(Mogollon Rim)花岗岩。

瀑布底部横卧着一根巨大的漂白原木,匹配点:Water Wheel Falls有一根标志性的「阶梯状」原木,已在那里停留多年。

瀑布上方,稀疏的河岸灌木和亚利桑那松林错综交织,展现出埃里森溪(Ellison Creek)走廊的典型植被景象。

当前,网友们对o3的考验仍在不断升级。

英伟达研究员Zhaocheng Zhu将一组长焦镜头拍摄的照片传递给o3,无EXIF数据,并关闭o3的记忆功能。

由于大多数网络上的照片都是使用广角镜头拍摄的,所以这张照片对o3来说应该非常棘手。

Zhu本人表示,如果不是透过镜头看到这个角度,自己也认不出来这个地方是我熟悉的地方。

结果,O3猜对了。

对于这张,它不仅准确地找到了拍摄地点,还认出了图中的山峰是圣罗莎山脉。

o2猜测了三个地点,其中之一便是正确答案——查尔瓦高地。

终于,在猜测这张照片的时候,O3翻车了。这是一张加拿大山脉的鸟瞰图,O3却认作是瑞士的阿尔卑斯山。

这些航拍照片在训练集中所占的比例很低,这大概是因为。

然而,o3不仅仅在猜测国外的地理位置,有国内开发者给了它自己上班路上随手拍的一张图,它居然也一步步准确分析出了位置信息——山东青岛市北区重庆南路47号。

请提供需要语言润色段落的内容,我将对其进行语言润色,提升表达质量,并返回润色后的单段内容。

人们质疑,是否照片中已经包含了定位信息?

Nanyi表示,iPhone拍照设置中仅涵盖拍摄参数,而不包含位置参数。

通过o3从鲁U推理出了青岛,从小海豚里搜出了旁边的店,然后又从百度地图和青岛本地宝里搜出信息、查看附近的邮局,最终确认的。

请提供需要语言润色的段落内容,我将对其进行润色。

未来技术的发展将会推动语言模型的演进,可能会出现更加智能、更加人性化的语言生成能力。例如,能够更好地理解上下文、捕捉细节、生成更加自然的语言等。

 分享

本文由网络整理 © 版权归原作者所有

共  条评论

评论

  •  主题颜色

    • 橘色
    • 绿色
    • 蓝色
    • 粉色
    • 红色
    • 金色
  • 扫码用手机访问

© 2025 www.trjyy.com  E-Mail:[email protected]  

观看记录