天天看點

揭秘Google地圖:算法再強,也需人工

揭秘Google地圖:算法再強,也需人工

導航地圖近十年已經發生了翻天覆地的變化。上世紀90年代,我們還在用紙質地圖尋找目的地。而現在基本隻需要服從siri或她的谷歌競争對手的導航指令。

“地面真相”(ground trut)算法和街景服務

不過這些導航指令背後隐藏着大多數人無法想象的衆多資料。目前由于谷歌已經獲得了極其龐大的地圖資料,他們開始采用大資料方法,或谷歌稱之為“地面真相”的算法和細緻的人工努力相結合的方法,為使用者提供更詳盡的地圖資訊。該項目于2008年推出,但它一直處于保密狀态,直到幾年前才公開。它持續增長,現已覆寫51個國家。這一算法在提取衛星、空中和街景視圖的資訊時發揮了巨大的作用。

揭秘Google地圖:算法再強,也需人工

谷歌“地面真相”算法可以識别的街景資訊

谷歌2007年推出了街景服務,通過讓人們看到目的地周圍的環境來提高使用者體驗。谷歌地圖副總裁布萊恩·麥克倫登(brian mcclendon)。表示,“我們很快就意識到做地圖的最佳途徑之一,就是擁有全世界的街頭照片。”

随着街景收集資料的增長,抽查他們的資料已經不是很好的解決方案。谷歌地圖産品經理馬尼克·古普塔(manik gupta)表示,現在街景車已經行駛700多萬英裡,覆寫美國99%的公共道路,“它實際上使我們能夠利用算法建立提取資訊之外的新資料層。”

這些算法借用計算機視覺和機器學習的方法來提取路邊的街道編号、企業名稱、限速交通标志等細節資訊。 不過很多資訊還是非常難以提取,麥克倫登表示,“停止标記常常很容易被忽略。轉彎限制對于導航來說也很重要,但對于谷歌的捕捉算法還很難處理。因為這些标記箭頭可能是被畫在道路上,它們可以是不同的顔色和大小。車道标記的分析更難,因為他們并不一緻。”

揭秘Google地圖:算法再強,也需人工

谷歌地圖普通使用者不可見的轉彎限制資訊。

路牌也是非常重要的資訊。駕駛者聽到的導航訓示如果能比對他們看到的,那麼他們就能更好的被指引。但有時街道标志使用的拼寫或縮寫導緻了很多麻煩。“比對标志上的文字實際上是一個很困難的任務。”

另外,谷歌的算法還可以利用衛星和航空影像提取建築物的輪廓和高度。美國大多數的建築物現在都可以在谷歌地圖上找到。對于像西雅圖太空針塔這樣的标志性建築,計算機視覺技術已經可以提取出詳細的3d模型。谷歌曾表示,它收購高分辨率衛星圖像公司skybox就是為了提高其地圖的準确性。

揭秘Google地圖:算法再強,也需人工

計算機視覺技術提取的标志性建築物3d模型

職業地圖糾錯團隊和mapmaker計劃

然而,衛星和算法的能力還是有限。為了提供最好的體驗,谷歌雇傭了一隻由人類組成的團隊,手動檢查并使用内部程式atlas糾正地圖的錯誤。谷歌公司以外很少有人見過這一應用。

這一人工檢查團隊看到的地圖類似于谷歌地圖的衛星地圖混合視圖,但帶有沒見過的彩色線條和符号。例如,道路根據行進方向進行了顔色編碼。綠色和紅色箭頭訓示了給定的交叉路口的可能前進方向。從業人員可以點選螢幕一側的按鈕,拖曳、切換或關閉各種層,控制街景視圖拍攝的交通标志的出現和消失。這些從業人員每天要檢查數以千計來自谷歌地圖使用者的錯誤報告,并根據需要進行修複。

揭秘Google地圖:算法再強,也需人工
揭秘Google地圖:算法再強,也需人工

從業人員可以手動将地圖道路(左上)對準衛星圖像

古普塔還展示了一張顯示道路優先級的地圖,線的寬度代表交通流量。谷歌一直用手機的位置信号映射交通條件。不過古普塔承認,位置信号也可以是其他資訊的良好來源,比如轉彎限制或者單行線。但他拒絕詳細說明,“谷歌在很多地方使用了位置資訊,但我不能談論具體的東西。”

除了職業地圖糾錯團隊,谷歌還得到來自mapmaker計劃的幫助。2011年谷歌推出了普通使用者可以參與的地圖糾錯項目,現在的該項目遍及220個國家。目标是提高谷歌地圖在開發中國家和其他地區的準确度。因為在那裡無法獲得詳細的地圖源,“我們招募使用者添加對于他們很重要的地圖資訊。我們會提供工具和衛星圖像,是以他們可以很輕松的進行修正。”

使用者可以提供公園、步道以及其他街景車無法進入的地方的資訊。麥克倫登本人就曾幫助繪制windy山的登山路徑,“我用gps記錄了我登山的路徑,完善了更多的精确路線。”

當你在筆記本電腦或手機上使用谷歌地圖時,表面的資訊之下隐藏着更多的資料。不隻是道路的布局,還包括連結一個點到另一個點的邏輯資訊。資訊不隻是建築物的形狀,也許未來谷歌地圖隻會不斷的細節化。最終,呈現出來的可能是讓人震驚的世界3d虛拟圖像。

揭秘Google地圖:算法再強,也需人工

道路标志可利用算法從街景中提取,進而提供交通資訊

原文釋出時間為:2014-12-10

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀