天天看點

揭秘真實的“AI民工”:為生存機械地“做任務” 時薪低至1美

作者:烹饪界推薦家常菜單

1.即使是最厲害的AI背後也是人,它需要大量人力标注資料來訓練它。AI标注員是人們希望自動化的工作,而且通常認為它們已經自動化了,但是仍需要人類的輔助。

2.他們把這份工作稱為“做任務”,自己也不知道幹的是什麼。

3.收入微薄,時薪低至1-3美元。

4.标注員抱怨稱“如果我讓某人成為億萬富翁,而我每周隻賺幾美元,我真的是在浪費生命。”

AI狂熱背後隐藏着一支民工大軍

人工智能(AI)的火熱不僅取代了一批工作崗位,也造就了新的産業,一支以“做任務”為生的龐大AI民工大軍正在悄然崛起中。

喬(Joe)今年30歲,幾個月前從肯亞首都内羅畢的一所大學畢業,找到了一份資料标注員的工作。這份工作單調乏味,整天就是處理用于訓練AI的原始資訊。AI通過在海量資料中尋找模式來學習,但是這些資料首先必須由人類進行分類和标記。人類就是隐藏在這些機器背後的龐大勞動力。

以喬為例,他的工作就是為自動駕駛汽車标記視訊,一幀一幀地從每個可能的攝像頭角度标記每輛車、行人、騎自行車的人以及任何車主需要注意的東西。這是一項艱難而又重複性的勞動。一個隻有幾秒鐘的視訊片段需要8個小時來标注,喬忙活半天隻能賺到大約10美元(約合72元人民币)。

不過,到了2019年,喬迎來了一個“發财機會”。由于一家新公司迫切需要标注員,他們成立了一個訓練營,培養新的标注員。喬成了這個訓練營的負責人,報酬是之前做标注員的四倍。

每隔兩周時間,50名新手就會排隊進入内羅畢的一棟辦公樓,開始他們的學徒生涯,這讓人感覺市場對标注員的需求似乎是無限的。他們被要求從那些對着鏡子自拍的照片中看到的衣服進行分類,通過機器人吸塵器的視角來确定他們所在的房間,并在雷射雷達掃描的機車周圍畫出正方形。

喬的一半以上學生通常在訓練營結束前就退學了。“有些人不知道如何長時間待在一個地方。”他委婉地解釋道。他承認,“這很無聊”。

稀裡糊塗“做任務”

但是,在一個工作稀缺的地方,這好歹是一份能夠糊口的工作。最終,喬還是培養出了數百名畢業生。訓練營結束後,這些學生回到家裡,獨自在卧室和廚房裡工作,被禁止告訴任何人他們在做什麼。其實,保密性并不是什麼問題,因為他們也幾乎不知道自己在幹什麼。

對于這些剛出師的學生來說,為自動駕駛汽車标記障礙物很好明白,但是對那些不知道是機器人還是人類說的扭曲對話片段進行分類,就沒那麼輕松了。他們要上傳自己的照片:先是一臉茫然地盯着攝像頭,然後咧着嘴笑,還要戴上機車頭盔。每個項目都是某個更大程式的一個很小組成部分,是以很難說他們到底在訓練AI做什麼。他們也無法從這些項目的名稱中尋找蛛絲馬迹:“蟹的傳人”、“鲸魚段”、“林地陀螺儀”和“藥盒香腸”,這些都是不着邊際的項目代号。

那麼,他們到底是在為誰打工呢?大多數人隻知道它叫Remotasks,是一家面向英語流利者提供工作的網站。和大多數标注員一樣,喬并不知道Remotasks是美國AI标注公司Scale AI旗下的外包公司。Scale AI是一家價值數十億美元的矽谷資料供應商,客戶包括OpenAI和美國軍方。不過,Remotasks和Scale AI的網站都沒有提到雙方的關系。

許多人對于ChatGPT等大語言模型的關注都集中在AI通過自動化取代的工作崗位上。但是,即使是最厲害的AI背後也是人,它需要大量人力标注資料來訓練它,并在它感到“困惑”時對資料進行澄清。隻有那些有錢購買這些資料的公司才能參與競争,這些公司在得到資料後會極力防止資料外洩。結果就是,除了少數例外情況以外,人們對于塑造AI系統行為的資訊知之甚少,對于塑造這些系統行為的人就更不了解了。

對喬的學生來說,這是一份“十分不正常”的工作:沒有時間表、沒有同僚、不知道自己在做什麼、也不知道為誰工作。實際上,他們很少把這項勞動稱之為工作,隻是稱之為“任務”,他們是任務工作者。

人類學家大衛·格雷伯(David Graeber)曾經給那些沒有意義的工作起了一個名字:“狗屁工作”,指的是那些本應該被自動化取代,但由于官僚主義、地位或惰性等原因而沒有自動化的工作。AI标注員的工作則與之相反:這是人們希望自動化的工作,而且通常認為它們已經自動化了,但是仍需要人類代替。這些工作确實有一個目的,隻是工作者通常不知道它是什麼。

标注大生意

目前的AI熱潮,就是源自這種前所未有的大規模單調乏味、重複性勞動。

2007年,時任普林斯頓大學教授的AI研究員李飛飛懷疑,改善圖像識别神經網絡的關鍵是使用更多資料進行訓練,需要數百萬标記圖像而不是數萬張。但問題是,她的大學生團隊需要花費數十年時間和數百萬美元才能給這麼多照片貼上标簽。

不過,當時亞馬遜已經擁有了一個衆包平台Mechanical Turk,世界各地的人們在這裡以低廉的價格完成小任務。于是,李飛飛在Mechanical Turk上找到了數千名資料标注工作者,創造了标注資料集ImageNet。它讓機器學習取得了突破,讓這一領域煥發新機,迎來了十年進步。

如今,标注仍然是AI開發的基礎組成部分。但是,工程師們經常覺得,對于建構大模型這一更迷人的工作而言,标注是一個短暫的、不友善的先決條件。你可以盡可能便宜地收集盡可能多的标記資料來訓練模型,如果它有效,至少在理論上你就不再需要标注員了。但是,标注永遠不會真正完成。在研究人員眼裡,機器學習系統是“脆弱的”。當遇到訓練資料中沒有充分解釋的東西時,它很容易失敗。這些失敗被稱為“邊緣情況”,可能會産生嚴重的後果。

例如,2018年,網約車巨頭Uber的一輛自動駕駛測試車撞死了一名女性。盡管該汽車的自動駕駛系統被進行了程式設計,要求避開騎自行車的人和行人,但它不知道該如何對待騎自行車過馬路的人。随着越來越多的AI系統被投入到世界中提供法律咨詢和醫療幫助,它們面臨的邊緣情況就越多,需要更多人類來協助解決。這已經催生了一個全球性産業,由像喬這樣的人組成,他們用自己獨特的人類能力來幫助機器。

标注是一門大生意。Scale AI由當年19歲的亞曆山大·王(Alexandr Wang)在2016年創立,2021年的估值已達到73億美元,這讓他登上了《福布斯》“最年輕的白手起家億萬富翁”榜單。不過,自那以後,他的股份在二級市場的價值已經下跌。

“标注生意擁有一套完整的供應鍊,”非營利組織AI夥伴關系(Partnership on AI)的項目和研究負責人索南·金達爾(Sonam Jindal)表示,“業内普遍認為,标注不是開發的關鍵部分,也不會長時間需要它。所有的興奮之情都圍繞着人工智能,一旦我們建立了它,就不再需要标注,是以為什麼要考慮它呢?但标注是AI的基礎設施。人類智慧是AI的基礎,我們需要将其視為AI經濟中的真正工作,這些工作将在一段時間記憶體在。”

OpenAI、谷歌和微軟等知名AI公司都有各自的資料供應商。一些私人外包公司擁有類似呼叫中心的辦公室,比如肯亞和尼泊爾的CloudFactory。喬就是在那裡做标注,每小時1.2美元,之後他才轉投Remotasks。還有像Mechanical Turk和Clickworker這樣的“衆包”網站,任何人都可以注冊來完成任務。中間層是Scale AI之類的服務,任何人都可以注冊,但每個人都必須通過資格考試和教育訓練課程,并接受績效監控。

怎麼接活?

今年早些時候,記者在Scale AI的外包公司Remotasks網站上進行了注冊。過程很簡單,輸入電腦組態、網速和一些基本的聯系資訊後,記者就來到了“教育訓練中心”。為了獲得付費任務,記者首先必須完成一個相關的無償入門課程。

教育訓練中心展示了一系列課程,但是這些課程的名字令人費解,比如“膠水泳衣”和“海報夏威夷”。記者點開了一個叫“GFD子產品化”的課程,這項課程是給社交媒體照片中的衣物進行标注。

不過,課程的指令很奇怪。例如,它們基本上是由相同的指令組成的,并用特殊的顔色和大寫字型進行強調,旁邊是用來警示的炸彈威脅拼貼畫。

“一定要給真實的、可以讓人類穿着或打算給真人穿着的物品貼上标簽。”指令是這麼要求的。

“下面的所有物品都應該貼上标簽,因為它們是真實的,可以被現實生活中的人穿着。”指令再次強調。這些物品來自一個AJ品牌廣告、一個戴着星球大戰凱洛倫頭盔的人,以及一個穿着裙子的人體模型。這些圖檔上面有一個石灰綠色的方框,裡面的文字再次解釋說,“給真實的人可以穿的真實物品貼上标簽”。

對于不能被标記的物品,指令也給了醒目的提示:“以下物品不應該被貼上标簽,因為人類在實際生活中不可能穿着這些物品!”

記者對于自己的分辨能力感到自信,于是就開始了測試。首先是一張雜志的照片,上面的女人穿着裙子。照片上的服裝是真實的服裝的嗎?記者認為不是,因為人不能穿照片中的服裝。但是,錯了!在AI看來,真實服裝的照片就是真實服裝。接下來是一張在昏暗卧室中,一個女人站在全身鏡子前自拍的照片。她穿着的襯衫和短褲是真實的。那麼倒影呢?同樣是真實的!真實服裝的倒影也是真實服裝。

經過尴尬的大量嘗試和錯誤後,記者終于開始了實際工作,卻驚恐地發現他一直在努力遵循的指令已經被更新和澄清了很多次,現在已經變成了一本有43頁的指令書:不要标記裝滿衣服而且打開的行李箱;标記鞋子但不要标記腳蹼;标記緊身褲但不要标記連緊身褲襪;即使有人穿着毛巾也不要标記它;标記服裝但不要标記盔甲。

收入微薄

Remotasks上的大部分工作都是按件計酬的,一項任務的收入從幾美分到幾美元不等。因為任務可能需要幾秒鐘或幾個小時,是以工資很難預測。标注員們稱,當Remotasks剛進入肯亞時,他們的報酬相對較高。根據任務的不同,平均每小時大約為5到10美元。但随着時間的推移,報酬會下降。

Scale AI發言人安娜·弗蘭科(Anna Franko)表示,該公司的經濟學家會分析項目的細節、所需的技能、地區生活成本和其他因素,“以確定公平和有競争力的薪酬”。Scale AI的前員工還表示,标注員的薪酬是通過一種類似動态定價的機制确定的,該機制根據可用的标注員數量和資料需要的迫切度進行調整。

根據記者的采訪和招聘公告,美國的Remotasks标注員通常每小時能掙10到25美元,一些專業标注領域的專家報酬更高。今年年初時,接受采訪的肯亞标注員的報酬已經降到了每小時1到3美元。

這還是能賺錢的時候。标注員對于Remotasks的工作最常見的抱怨就是它的不穩定性。它或許能在很長一段時間内給标注員提供足夠穩定的工作,可以作為全職工作,但也充滿了不可預測性,使人無法依賴它。标注員花費數小時閱讀指令和完成無償教育訓練,結果隻能完成幾十個任務,随後項目就結束了。接着,标注員可能幾天都沒有新任務,然後再突然出現一項完全不同的任務,可能持續幾個小時到幾周時間不等。任何任務都有可能是他們的最後一項任務,他們永遠不知道下一個任務何時到來。

工程師和資料供應商稱,這種時有時無的工作取決于AI開發的節奏。訓練一個大模型需要大量标注,然後是更多的疊代更新。工程師們希望所有這些都盡可能快地完成,這樣他們就能趕上目标釋出日期,可能在幾個月的時間裡就需要數千名标注員,然後減少到幾百名,接着隻需要十幾名特定類型的專家,然後又需要數千名。“問題是,誰來承擔這些需求波動的成本?”AI夥伴關系的金達爾說,“因為目前承擔這些成本的是标注員們。”

抱團取暖

為了取得成功,标注員們會互相合作。維克多(Victor)在内羅畢上大學時就開始為Remotasks工作。當記者告訴他自己在交通導向員任務中遇到的困難時,他表示大家都知道要遠離那個任務:任務太棘手、報酬還低,不值得做。

和許多标注員一樣,維克多使用非官方的WhatsApp群聊,在有好任務時通知大家。當他弄清楚一個新任務時,他會即興使用谷歌視訊會議服務Meets與其他人分享如何完成任務。任何人都可以加入會議,一起研究,分享技巧。“這是我們培養起來的互相幫助的文化,因為我們知道,單憑一個人是無法掌握所有技巧的。”他說道。

由于工作會毫無征兆地出現又消失,是以标注員們總是需要保持警惕。維克多發現,項目會在深夜突然出現,是以他習慣每三個小時左右醒來檢查一下他的任務隊列。當有任務時,他會保持清醒,隻要能讓自己工作。有一次,他熬夜36個小時,在人群照片中給肘部、膝蓋和頭部做标記,他也不知道這麼做是幹什麼。還有一次,他熬夜太久,媽媽問他眼睛怎麼了。他照鏡子後才發現,眼睛腫了

标注員通常隻是模糊地知道他們正在為其他地方的企業訓練AI,但有時這種神秘感會消失,因為指令中提到了某個品牌或聊天機器人說得太多了。“我讀了一些資料,并通過谷歌搜尋發現,我正在為一位25歲的億萬富翁工作。”一名員工說,他當時正在給打電話訂購達美樂披薩的人的情緒貼标簽。

“如果我讓某人成為億萬富翁,而我每周隻賺幾美元,我真的是在浪費我的生命。”他不滿地說。

沒人會記住我們

維克多自稱是一名AI“狂熱者”。他開始做标注,是因為他想幫助實作一個完全自動化的後工作未來。但是今年早些時候,有人在他的WhatsApp群裡發了一篇《時代》雜志的報道,内容是标注員訓練ChatGPT識别有毒内容,但是Scale AI支付給他們的時薪不到2美元。

“這些公司利潤豐厚,但支付給标注員的薪酬卻如此之低,這讓人感到憤怒。”維克多說。當被告知Remotasks與Scale的關系時,他才知道自己參與的其中一項任務的指令與OpenAI使用的幾乎相同,這意味着他可能也在訓練ChatGPT,時薪大約3美元。

“我記得有人發帖說,我們将來會被人銘記,”他說,“然後,另一個人回複說,我們的待遇比步兵還差,未來我們什麼也不會被記住。這段話我記得很清楚。沒有人會認可我們所做的工作和付出的努力。”鳳凰網科技《AI前哨》對此将持續關注。

本文源自鳳凰網科技