天天看點

萬萬沒想到,無人車其實是個勞動密集型産業

本文來自AI新媒體量子位(QbitAI)

病友們都在看雜志、刷Instagram的時候,Shari Forrest打開了手機上的一個app,開始訓練一個将要用在無人車上的人工智能。

54歲的Forrest并非工程師或程式員,她靠撰寫教材來謀生。盡管如此,在平時有空時,Forrest依然會在Mighty AI上登入,然後把自己的時間花在給行人、垃圾桶,以及任何其他你不希望無人車撞上的東西做标記上。

Mighty AI是一家人工智能衆包服務平台。在這裡,Forrest的“同僚”們在全球範圍内還有20萬人。這家公司提供的主要服務包括計算機視覺、自動駕駛、自然語言處理等。今年1月,公司剛剛宣布完成1400萬美元B輪融資。

“如果能趁着排隊的工夫賺幾塊錢的話,何樂而不為呢。“Forrest說。

萬萬沒想到,無人車其實是個勞動密集型産業

對于無人車産業而言,在自動駕駛時代真正到來之前,類似Forrest所做的這種資料标注工作都是不可或缺的。要對自動駕駛賴以實作的AI進行訓練,所需的資料量往往超出了想象。

谷歌和通用這種公司很少去提這件事情,但正是像Forrest一樣的人們組成的勞動力大軍,構成了那些嗡嗡作響的資料中心背後的基石。

多數開發自動駕駛技術的公司會聘用成百上千名員工,然後把這種教會無人車識别行人、騎行者和其他障礙物的工作外包到印度或中國。這些勞工需要對長達數千小時的視訊逐幀進行标記。

“機器學習是個神話,就像《綠野仙蹤》一樣。”矽谷硬體孵化器公司Lemnos Labs的投資人Jeremy Conrad說,“标記團隊對每家公司都至關重要,我們一段時間内仍然需要他們,因為戶外環境十分多變。”

人工智能、傳感器品質和計算能力的巨大進步,給無人車的革命打下了技術基礎。然而,盡管出現了這些創新,但在未來很多年内,人類仍然需要在幕後默默奉獻,才能讓這些系統保持最好的狀态。

“在我看來,人工智能從業人員整體都很自大,認為電腦可以解決一切。”Mighty AI創始人兼CEO Matt Bencke說。人工智能系統也都存在同樣的問題:電腦需要通過人工添加标簽的龐大資料進行“學習”,然後利用這種‘模型’在今後看到類似的物體和形态時将其識别出來。

訓練無人車面臨的挑戰比其他人工智能應用更大,因為汽車所要面臨的場景和環境是開放性的。即便是針對不同時間的燈光和天氣環境進行調整後,城市環境仍會因為建築、活動或事故而在一夜之間發生變化。

萬萬沒想到,無人車其實是個勞動密集型産業

“标注過程通常都是一項非常隐秘的成本,很少被人提及。”自動駕駛創業公司Drive.ai首席執行官Sameep Tandon說,“這非常痛苦,也非常麻煩。”

無人車所需的精度也高于其他人工智能系統。汽車之是以能夠自動駕駛,是通過将它們借助攝像頭和傳感器看到的周圍環境,與車載3D地圖進行比對來實作的。安全是頭等大事:如果Google Photos的面部識别無法正确認出一張照片中的人,那也沒什麼大不了;但如果Waymo的無人車無法識别行人,就會引發緻命事故。

在争相開發無人車的過程中,企業的衡量标準都是他們的累計行駛裡程。Waymo今年5月表示,他們的汽車已經在公共道路上試駕了300萬英裡,而特斯拉去年表示,他們已經借助Autopilot系統,通過現有的車主收集了1000多萬英裡的駕駛資料。

然而,裡程越多,就意味着這些公司的背景資料處理人員需要手工從事更多工作。短短幾英裡的駕駛裡程就會産生數十GB的資料,這些資料很快就會變得過于龐大,以至于無法通過車載無線網絡進行傳輸。相反,必須首先儲存在硬碟之中,然後再傳輸到到外包中心。

這樣一個擁有尖端技術的行業,卻采用如此陳舊的模式,的确令人感到意外。

矽谷自動駕駛系統開發公司PlusAI首席執行官David Liu表示,每駕駛一個小時,就需要花費數百個小時才能将其轉化成有用的資料。

他說,“我們需要幾十萬,甚至幾百萬小時的資料”才能讓無人車随處行駛,并且需要“數十萬人來實作這一目标”。

但大型科技公司通常不肯披露無人車所涉及的人工程式。Waymo、Uber和特斯拉均拒絕對此置評。

萬萬沒想到,無人車其實是個勞動密集型産業

“很難聽到有人談論此事。”華盛頓大學計算機科學與工程教授Dan Weld說,“他們都喜歡說,機器學習很神奇。”

曾經擔任Waymo和Uber工程師的Anthony Levandowski曾于2013年在加州大學伯克利分校的公開演講中,将谷歌的印度團隊稱作一個由“人類機器人”組成的團隊,他們負責标記街景服務采集的各種圖像。

這種勞動密集型工作的成本并不低。業内人士估計,要建立和維護每座美國城市的地圖,一年的花費約為數十億美元。

Mighty AI的 Bencke指出,Facebook、YouTube和Twitter面臨的挑戰,是如何在他們的社交平台上應對欺淩和恐怖主義等各種負面内容。“如果深度學習具備這種能力,你不認為它現在就應該已經解決這個問題了嗎?”他說,“這個問題沒有無人車那麼複雜,而且市場很大。”

當下,AI的智慧在更大程度上仍然取決于它所用來訓練的資料的品質。Bencke稱自家的平台會用自己的機器學習技術,來判定每個人最為擅長的領域,并以此來配置設定工作。沒人是以變得富裕,但對于Mighty AI來講,這無關緊要。

Forrest說,自己去年在這項工作上掙了300美元,大部分都用來網購了。她從沒見過無人車,更别提乘坐一次。但她知道自己正讓它們變得更為聰明,也對這項技術的未來充滿信心。

【完】

本文作者:李杉 唐旭

原文釋出時間:2017-07-10

繼續閱讀