天天看點

你的照片在哪兒拍的,AI一下子就能看出來

作者:萬物雜志

原創文章版權歸微信公衆号

“把科學帶回家”所有

你的照片在哪兒拍的,AI一下子就能看出來

撰文 | Cloud

審校 | 阿娴

“你好!明天是母親節,我媽媽大約八年前去世了。我不知道你能否看出這照片是在哪兒拍的,因為我當時還很小,不記得了。”

你的照片在哪兒拍的,AI一下子就能看出來

圖檔來源:georainbolt

在判斷照片拍攝的地理位置方面,25歲的特雷弗·雷恩博爾特(Trevor Rainbolt)是有名的專家,他經常收到網友讓他幫忙尋找老照片拍攝地的請求。憑借出色的判斷,他幫助了很多人。

雷恩博爾特是GeoGuessr這款看照片猜位置遊戲的專業玩家,他的走紅也讓很多人知道了這款遊戲。出色的成績離不開長時間的訓練,他玩這個遊戲的時間已經超過一萬個小時,疫情期間每天能玩四到八個小時。

不過,今年五月,他敗給了AI。

這個厲害的AI玩家由斯坦福大學的三名研究所學生開發,用時大約兩個月。在訓練時,它猜出照片拍攝地所在國家的正确率是92%,玩GeoGuessr的平均分高達4525(滿分是5000分),在全球玩家中排前0.01%。

你的照片在哪兒拍的,AI一下子就能看出來

AI有時候接近滿分 | 圖檔來源:georainbolt

面對這個AI對手,雷恩博爾特也甘拜下風。不過,這個AI可能帶來的隐私風險,也讓很多人感到不安。

如何判斷圖像位置

和雷恩博爾特一樣,AI的三位研發人員也是GeoGuessr的資深玩家。

GeoGuessr是一款線上地理猜測遊戲,大約有5000萬個玩家,由瑞典的一位軟體工程師在2013年開發。進入遊戲時,玩家會被随機放置在谷歌街景的某個地方,然後根據畫面資訊猜測自己所處的地理位置,最後玩家需在世界地圖上的某個地方放置一顆圖釘,标記出自己的推測地點。遊戲的玩家大多都很年輕,一些最優秀的玩家甚至隻有14歲。

你的照片在哪兒拍的,AI一下子就能看出來

雷恩博爾特對陣AI時第一輪出現的圖像,你也來猜猜看吧 | 圖檔來源:georainbolt

玩家猜測的準确度和速度決定了得分高低。猜測的位置越接近實際位置,玩家赢得的分數就越多。另外,越快完成猜測的玩家也會獲得更高的得分。

你的照片在哪兒拍的,AI一下子就能看出來

第一輪比賽分數 | 圖檔來源:georainbolt

遊戲所提供的谷歌街景圖像中的任何細節都是玩家們判斷的依據。照片裡地上的土、電線杆、街道标志、道路标線、人們的穿着、植物、可見的景觀等線索都能用來判斷位置。當然,玩家個人的直覺也很重要。

關于判斷技巧,雷恩博爾特會建議先去找圖裡的護柱和電線杆,這些東西每個國家或地區都有非常獨特的設計。例如,丹麥的護柱上有黃色的頂部,德國的是黑色的。

你的照片在哪兒拍的,AI一下子就能看出來
你的照片在哪兒拍的,AI一下子就能看出來
你的照片在哪兒拍的,AI一下子就能看出來
你的照片在哪兒拍的,AI一下子就能看出來
你的照片在哪兒拍的,AI一下子就能看出來

向左滑動檢視更多護柱

你的照片在哪兒拍的,AI一下子就能看出來
你的照片在哪兒拍的,AI一下子就能看出來
你的照片在哪兒拍的,AI一下子就能看出來
你的照片在哪兒拍的,AI一下子就能看出來
你的照片在哪兒拍的,AI一下子就能看出來

向左滑動檢視更多電線杆

再比如,電線杆使用的材料也有講究,有些是木頭的,有些是混凝土的。電線杆的形狀也各有不同,杆上面的貼紙也是一個線索。“澳洲95%的混凝土電線杆都在維多利亞州,”雷恩博爾特說道。

你的照片在哪兒拍的,AI一下子就能看出來

在澳洲的塔斯馬尼亞,電線杆有防止袋貂攀爬的裝置 | 圖檔來源:wired

專業的玩家會學多種語言,記住不同國家都有哪些不同的東西,例如知道哪些國家使用三重白色道路線,哪些國家有虛線道路線,哪些國家有綠色的道路标志,标志上是什麼樣的字型,道路所使用的建造材料、道路長度、路上的汽車車牌和汽車類型,以及道路兩邊的植被類型……所有看似普通且微小的細節統統都是遊戲線索。

你的照片在哪兒拍的,AI一下子就能看出來

圖檔來源:georainbolt

除了畫面的内容,谷歌街景拍攝的圖像品質也有差別。作為世界上國土面積最小的共和國,聖馬力諾是一個被意大利包圍的國中國,這裡的街景和意大利看着很像。但是,兩者的圖像品質卻不一樣——聖馬力諾的差一些。

你的照片在哪兒拍的,AI一下子就能看出來

被意大利包圍的聖馬力諾 | wikipedia

另外,你有時候還會看到谷歌街景車的一小部分,如果看到街景車的頂部有黑色膠帶,那麼就表明圖檔所在位置是非洲西部國家加納。

你的照片在哪兒拍的,AI一下子就能看出來

街景車上的黑膠帶 | 圖檔來源geoguessr

玩家們還會分享各種線索,但是由于谷歌街景圖像有2200億多張,是以要記住所有提示不太現實,大師級的玩家往往也很依靠直覺。

AI雖然沒有人類玩家這樣的第六感,但是它不僅能看到人類能看到的明顯特征,也能關注到被人忽視的微小細節。

AI擊敗人類玩家

去年,斯坦福大學的一群研究所學生正在學習人工智能課程《深度多任務和元學習》( Deep Multitask and Meta Learning),三個都愛玩GeoGuessr的學生需要一個項目,于是他們決定從共同的愛好出發,試試看能否打造出一個比人類玩家更厲害的人工智能玩家。

他們的項目名稱是“預測圖像地理位置”(Predicting Image Geolocations),根據字母的首字母将其簡稱為PIGEON(鴿子)。他們采用了OpenAI(也是ChatGPT的開發公司)制作的CLIP神經網絡,通過閱讀文本來了解、分析圖像。之後,他們再用谷歌街景圖像來訓練這個系統。訓練的資料集包含的谷歌街景圖像大約有50萬張。

AI會把圖像分成一個個的非常微小的方塊進行分析,并且非常擅長從中選出那些特殊的方塊。而對AI而言,一張圖檔其實不僅僅是圖像,還有相對應的文本資訊。通過綜合圖像中的建築物、街道布局、植被和地标等視覺資訊,以及天氣條件、季節和氣候等其他的輔助資訊,AI也能像頂級玩家那樣對圖檔的拍攝地進行快速預測。

你的照片在哪兒拍的,AI一下子就能看出來

面對一張圖檔,AI既分析文本,也分析圖像 | 參考資料[1]

盡管資料集規模相對較小,但最終AI系統表現還是非常不錯,不僅準确率高,誤差和人類猜測的相比也更小,可以定位到實際地點周圍大約40千米以内。在和雷恩博爾特的比賽中,AI輕松地赢了好多輪。

你的照片在哪兒拍的,AI一下子就能看出來

AI模型對圖像中不同區域的關注程度,可以看出相機上的污點 | 參考資料[1]

“我們并不是第一個與雷恩博爾特對抗的AI,我們隻是第一個戰勝雷恩博爾特的AI。”AI系統的開發者之一米哈爾·斯克雷塔 (Michal Skreta) 說道。

你的照片在哪兒拍的,AI一下子就能看出來

AI猜測的位置更加接近實際地點 | 參考資料[1]

他們認為這項技術具有多種潛在的應用前景,例如可以識别需要修複的道路或電線,迅速發現入侵植物。在之後的研究中,他們還将進一步改進模型,以提高定位的準确性,另外将擴大地理定位的資料集,涵蓋更多的地理區域和環境,以提高模型的泛化能力(指模型在面對未曾見過的資料或新的情境時的表現能力)。

可能的風險

這個程式似乎已經可以對街景之外的照片進行地理定位。“我給了它一些十多年前公路旅行中的一些照片,它找出了其中的大部分地方。它猜到了黃石公園内的一個露營地,距離大約55千米。另一張照片是在舊金山的一條街道上拍攝的,它猜出的地點就距離幾個街區。這引起了一些專家的擔憂。”美國國家公共電台的科學編輯傑夫·布魯姆菲爾 (Geoff Brumfiel) 說道。

面對不斷強大又缺乏監管的AI,個人隐私安全保護起來似乎越來越難了。從隐私角度來看,我們的位置可能是一組非常敏感的資訊。過去,人們可以删除照片的GPS位置标記,現在這可能也不起作用了。

一個預算很低的學生項目就有如此大的潛力,企業和更大的機構或許能夠更加輕松地監視普通人,而圖謀不軌的人也能更容易地跟蹤、傷害他人。

既然赢不了AI,那就享受遊戲過程吧,猜猜這張照片出自哪裡?

你的照片在哪兒拍的,AI一下子就能看出來

繼續閱讀