當前位置: 華文世界 > 科技

小心!最新AI看一眼照片就定位你在哪裏,精確到經緯度

2024-05-15科技

金磊 發自 凹非寺

量子位 | 公眾號 QbitAI

有點恐怖。

現在,AI只需 隨意一張照片 ,就能知道你在哪裏,而且是可以精確到經緯度的那種!

例如下面這張隨便到不能再隨便的自拍,你能猜到小姐姐在哪裏嗎?

這事交給現在的AI來處理,它只需要「看」一眼,就能把照片裏的 「底褲都給扒出來」

美國,加利福尼亞州,舊金山機場洗手間,93號登機口附近……

座標:37.6189° N,122.3744° W

再如下面這張照片,AI根據湖的特征、樹木和背景中的山脈,就匹配到了 瑪麗湖 ,同樣是給出了精準的座標:

恐怖如斯,恐怖如斯。

至於這個AI工具,則是最近由一位俄羅斯黑客所推出,名叫 GeoSpy ,號稱是可以根據照片裏的各種細節做分析來判斷地理位置。

包括光線、植物、建築風格、天氣,並將它們與大量模組屋/地理照片進行對比,據說也用到了地理空間視覺大語言模型的技術。

而GeoSpy的功能,像極了此前一款基於谷歌地圖的遊戲 GeoGuessr ——

遊戲中會展示一張模組屋圖,然後玩家要從地圖上找到它的座標位置;給出答案與正確座標越近,分數越高。

之前也有一位國外小哥(ID:georainbolt) 憑借只需看 0.1秒 模組屋,就能在世界地圖上快速釘選位置而在網絡上躥紅。

果不其然,史丹佛電腦系學生Andrew Gao在嘗試了GeoSpy之後,就開始喊話這位小哥了:

你要失業嘍~

不過也有GeoGuessr的職業玩家坐不住了,站出來表示不服:

申請一戰!

人類 vs AI

這位挑戰者,名叫做 Gavin (下文我們簡稱「G哥」) ,是一位正在參與GeoGuessr 2024世界杯的職業選手。

G哥把他跟AI線上對壘的情況上傳到了網上。

規則和GeoGuessr一致,還是看圖猜位置。

在第一圈對決中,G哥憑借抓到了馬路道邊上土耳其樣式柱子的細節,判斷這張圖可能是在土耳其附近。

結果顯示,這張圖裏的位置確實是在土耳其附近,但距離精準的位置還差241km。

接下來就輪到GeoSpy這個AI選手登場了。

G哥處理的方式是將截圖「投餵」給AI,在靜候了片刻之後,GeoSpy就給出了結果。

國家:土耳其

經緯度:39.998923, 32.607491

然後G哥在地圖中搜尋這個經緯度,再跟GeoGuessr的「標準答案」做比較:

第一圈的結果可以說是讓G哥大受震驚,GeoSpy給出的位置比他的更近……來看下G哥當時的表情:

在接下來的「火拼」中,G哥變得更加仔細,都湊近螢幕去捕捉細節了。

G哥這次給出的答案是蘇門答臘島,但實際的結果卻不是很理想,距離「標準答案」足足703km。

到了GeoSpy這邊,雖然大致位置都是在印度尼西亞,但這次給出的位置就沒有那麽準確了。

不過比起G哥給出的答案,距離上卻還是AI的答案更近些,這使得G哥開始有點無語子……

在接下來的比試中,即便G哥把猜測距離壓縮了86km,但GeoSpy給出的結果又是更接近於「標準答案」。

G哥此時已經開始掩面了:

在最後一輪battle中,G哥直接說出:

人類必須反將AI一軍。

然後G哥把頭埋得更深了,當他捕捉到圖中路邊有文字時,臉上露出了得意的笑容:

這局穩了,AI它不識字的。

G哥的結果是,距離標準答案134km。

不過令G哥萬萬沒想到的是,GeoSpy,它!識!字!

這張照片是在波蘭拍攝的,因為建築物上寫著「Abet」,這是一家波蘭公司。

然而G哥還是覺得這把有希望,因為他發現GeoSpy只能定位到城市。

所以這把如果AI給出的座標是「標準答案」旁邊的城市「華沙」,那麽G哥就贏了。

結果還真是……G哥也是露出了久違的笑容,並驕傲地說:

AI永遠不會打敗人類!

(Emmmm……G哥,你非要這麽算的話……也行。)

G哥在下一輪的比拼中,將地圖範圍縮小到了自己的老家——芝加哥。

這次在自己的地盤上,G哥的表現非常勇猛,有距離「標準答案」僅2m和4m的成績。

不過AI這邊也是非常精準,起碼在看圖描述的過程中可以精確地說出周邊的地址,這也讓G哥著實捏了一把汗。

但在地圖上搜AI給出的座標的時候,卻比文字描述的地點遠一些了,有的甚至還定位到了海上。

……

最後,G哥在與AI交鋒了數次之後感慨道:

這次體驗非常有趣並且讓人印象深刻。

但我也害怕這樣的技術在未來5年後會叠代到什麽樣的程度。

也會頻頻翻車

其實在剛才G哥體驗的過程,我們就能發現GeoSpy也存在一定的bug。

例如它更傾向於把地點定位到某個城市,以及給出的經緯度座標會跟文字描述的地點有偏差。

網友們在實際體驗過後也有類似的感覺。

以至於許多人開始懷疑這個GeoSpy到底是不是憑借所謂的「地理空間視覺大語言模型」技術。

畢竟現在每張照片的背後就會有大量且豐富的資訊:

但無論如何,這件事情倒是給我們敲了一個警鐘——

技術的發展雖然日新月異,但我們也要時刻警惕數據安全的問題;平常一定要註意,不然一不小心就可能被開盒。

參考連結:
[1]https://weibo.com/6444741184/OdDVBnynj#comment
[2]https://www.youtube.com/watch?v=FitqxvDuEIY
[3]https://www.reddit.com/r/geoguessr/
[4]https://twitter.com/WSXJPDD/status/1786728819446931488
[5]https://twitter.com/gregorycgravett/status/1785894800488583591

— 完 —

量子位 QbitAI · 頭條號簽約

關註我們,第一時間獲知前沿科技動態