天天看點

AI苦工卷向高學曆,美國博士正在搶走印度人工作

AI苦工卷向高學曆,美國博士正在搶走印度人工作

美國人馬特擁有通信博士學位,他最近喜提一份自由職業:成為Scale AI公司的一員,在家訓練AI模型。

“通信博士”“訓練AI模型”,馬特是不是成了一名光榮的AI程式員?事實并非如此。馬特的工作很無聊:他在Scale AI的系統中“接活”,以使用者的角度浏覽AI模型給使用者的各種回複,判斷AI有沒有說錯,然後提供回報。比如為谷歌的AI訓練預訂航班,稽核哪些ChatGPT的答案會得到使用者的差評。

Scale AI自己不生産大模型,它和谷歌母公司Alphabet、OpenAI、Meta等衆多AI生産商達成合作,為它們提供“人類”。

隻不過,來自非洲、印度、菲律賓等地的廉價勞動力,已經不足以滿足客戶的需求。Scale AI已經開始收縮其海外業務,在美國本土雇傭數十萬勞動力,其中不乏像馬特一樣的高知人士。

AI苦工卷向高學曆,美國博士正在搶走印度人工作

這家成立了8年的大模型資料标注公司,在今年5月剛剛完成了10億美元F輪融資,由Accel領投,亞馬遜、英特爾、AMD、思科、Meta、老虎全球基金等全球知名公司跟投。公司預計今年銷售額将超過10億美元,使其成為生成式AI公司中銷售額排名靠前的公司之一。

而它的最新估值,已經達到了138億美元。這放在所有AI初創公司中,都是一份不俗的成績,遠遠超過矽谷明星公司Hugging Face去年8月融資後的45億美元估值,更接近埃隆·馬斯克(Elon Musk)的xAI,其最新一輪融資後估值180美元。

A

讓人類給AI打苦工的Scale AI,已經是當下AI競賽中很關鍵的彈藥庫。

當我們提到“大模型訓練”時,會想到的是用數千個先進晶片驅動大模型,讓其分析數百億位元組的文本,其實這隻是第一步——預訓練。

但僅靠這些,不足以確定像Anthropic的Claude、OpenAI的ChatGPT、Meta的Llama和谷歌的Bard這樣的系統提供以人類風格編寫的正确答案。

為了實作這一點,需要進行第二步:微調。這就涉及大量的人力,有可能是AI生産商在公司内部雇傭,也有可能是來自Scale、Surge AI、Labelbox、Telus International等公司。這些公司提供大量的人,為客戶的聊天機器人寫下理想的回應,手把手教機器人提供更“完美”的答案。

為AI模型提供資料标注服務的公司并非全新的存在,上一次讓這類公司起飛的風是自動駕駛。

Scale AI就成立于2016年。事實上,Scale AI從一開始就和OpenAI頗有淵源,其孵化于Y Combinator(下稱YC)的初創企業賽馬項目,項目還未結束就已經獲得了YC的支援。而YC彼時的總裁,正是後來聯合創辦了OpenAI的山姆·奧特曼(Sam Altman)。

AI苦工卷向高學曆,美國博士正在搶走印度人工作

不過,彼時“千模大戰”還未開始,Scale AI首先趕上的是席卷矽谷的自動駕駛技術熱潮。實作自動駕駛,需要訓練AI算法,而當時沒有其他外包公司擁有對自動駕駛汽車的雷達和傳感器生成的三維圖像進行資料标注的能力。

Scale AI的工程師最初花了幾個月,為自動配送初創公司Nuro建立了3D标注産品。很快,Alphabet的Waymo和通用汽車的Cruise,甚至是蘋果,都成了Scale AI的客戶。

在2017年底,Scale AI雇傭了1000多名标注員,主要在菲律賓。平均來說,這些合同工的時薪是1.5美元,每周工作10個小時。

到了2019年,OpenAI也已經成立幾年,并且将方向主要專注在了開發AI大模型上,随後成為Scale AI的客戶。隻不過彼時AI大模型客戶對于Scale AI來說并不是關鍵收入來源。

随着自動駕駛技術的熱潮漸漸回落,市場回歸理智,Scale AI也遭遇了危機。在2022年,Scale AI的收入增長已經下降了50%,讓投資人頗為失望。

然而,2022年年底,OpenAI釋出了ChatGPT,Scale AI的“第二春”瞬間綻放。

除了OpenAI之外,Scale AI也與Meta和谷歌母公司Alphabet達成了圍繞大模型的合作。公司的收入從2022年的2.27億美元,飙升到2023年的6.8億美元。

站在風口之上,Scale AI喊出2024年收入增長206%的目标,并希望實作盈利。

B

在這個節點,Scale AI也開始做出一些改變,來自海外的廉價勞動力隻能負擔很基礎的任務,但大模型驅動的産品在寫作、程式設計、專業知識等方面都開始“卷”,Scale AI需要更新手裡的“雇傭兵”。

在一份投資者示範文稿中,Scale說它正在建設的是至關重要的AI基礎設施。該公司開始将自己打造成一個“AI的資料鑄造廠”,讓人聯想到半導體公司。

Scale AI的創始人也開始公開談論持有博士學位的人,或者醫生、律師等在訓練AI系統上的貢獻:“我們需要最優秀和最聰明的頭腦來貢獻資料。”

根據Rest of World的報道,Scale AI最近關閉了肯亞、奈及利亞和巴基斯坦的承包商站點。公司的焦點轉向美國本土,招募高知人士,來幫助訓練大模型的專業知識。

大約有30萬人通過Scale AI子公司Outlier運作的工作群等着“派活兒”。

美國本土的Scale AI“雇傭兵”并不廉價,平均時薪可以達到40美元。不過這份工作仍然擺脫不了“苦工”的體驗感。

AI苦工卷向高學曆,美國博士正在搶走印度人工作

在美國馬薩諸塞州的梅麗莎·誇西(Melissa Quashie)就以每個小時40美元的薪酬在Scale AI接活,她是一位自由職業者和編輯。她的任務包括評估由大模型生成的不同響應,根據模型回答問題的方式以及回答的内容品質來給出評分。

對誇西來說,在Scale AI的工作就像是“我玩過的最呆的電子遊戲”。她曾經花了兩個小時編寫一個“三天餐譜”,隻是為了給聊天機器人改進答案。

此外,随着Scale AI積累大量的勞動力,供求關系已經開始不平衡。很多時候,Scale AI派發的客戶任務已經難以滿足“雇傭兵”的需求。很多人發現,這份工作雖然時間靈活且薪水誘人,但許多時候都會無事可做。The Information采訪的10位Scale AI“雇傭兵”中,大部分人都有相同的抱怨。

也許是在AI浪潮下公司業務擴充的速度太快,也許是比起勞力們的工作體驗,Scale AI更專注于服務好客戶。總之,Scale AI也開始暴露其他的問題,除了吐槽派的活不夠做之外,人們也抱怨其教育訓練不足以及系統經常崩潰。

更惱人的還要數薪酬結算,即便是在美國本土為Scale AI提供勞力的“高知人士”,也沒有什麼話語權。開頭提到的博士馬特就表示,他被Scale AI無故踢出平台。

薪酬的結算不看工作量,而是要考核品質,而最終解釋權自然歸Scale AI所有。而且即便理應收到報酬,也可能因為客戶遲遲不确認而沒有着落。

C

根據工作品質而不是工作量為苦力們結算,這有助于Scale AI控制成本,而這對于Scale AI來說是現階段的關鍵卡點。

随着公司将焦點從提供廉價勞動力的海外市場轉移到美國,Scale AI的成本也更難控制。根據The Information擷取的财務資料,Scale AI的毛利率(包括支付給人類苦工的成本),從2022年的59%下降到了2023年的49%。

與此同時,Scale AI告訴投資者,它正在努力降低成本。該公司預測,今年将提高毛利潤率5個百分點,然後到2025年提高到60%。

公司告訴投資者,它正在通過使用内部工具自動識别“高效專家”來降低人工訓練模型的成本,以及依靠計算機生成的資料來增加人類工作的效率。

另一個壓縮成本的方式是減少内部員工(和“雇傭兵”不同,此處指的是在Scale AI工作的正式員工),2023年2月,Scale AI一方面已經看到了AI浪潮的來臨,另一方面也看到了宏觀經濟的影響以及矽谷的裁員潮,它抓住機會,也大刀闊斧裁員20%。

除了盡力壓縮成本之外,Scale AI也在想方設法拓展業務。

雖然很多員工反對,但Scale AI早已把不與政府合作的承諾抛之腦後。最近幾個月,Scale AI的聯合創始人亞曆山大·王(Alexandr Wang)與美國陸軍将領在華盛頓共同登台,公司每年從政府合同中獲得超過1億美元的收入。此外,他還前往卡達,與政府官員進行閉門會議,卡達也熱衷于開發自己的大語言模型。

在為AI生産商提供大量人力之外,Scale AI也提供AI生成的合成資料集——用AI生成的資料,訓練AI,以滿足AI大模型訓練中不斷膨脹的胃口。

AI苦工卷向高學曆,美國博士正在搶走印度人工作

現階段“高品質的人類”依舊是Scale AI最賴以生存的“資源”,是以公司也在采取措施維護“高品質人類”中的那些佼佼者。

在美國德克薩斯州奧斯汀和佛羅裡達州的傑克遜維爾,Scale AI曾舉辦為期數天的研讨會,邀請幾十名“頂級苦力”前往參加。

一位參加奧斯汀研讨會的人說,大約有50名訓練師參與了一個據悉Alphabet的Bard聊天機器人相關的項目。他們讨論了每個人為不同提示寫下的回應,并在晚上一起唱卡拉OK。

在傑克遜維爾,誇西遇到了大學教授、博士生、編劇和播客主持人。“我們連續工作六個小時,然後喝杯葡萄酒。”

“每個人都非常興奮地改善大語言模型。但沒有人談論的是,因為我們在做這份工作,誰會失去他們的工作?”

諷刺的是,數以十萬計的人類在為AI打工,就是為了讓AI的表現越來越好。而當AI足夠好的時候,這些苦力也許也是會被首先抛棄的那批人。畢竟如果AI能自産自銷,何必依靠每小時需要40美元的“高知苦力”?

也許更進一步的問題是,為AI販賣人類勞動力的日子還能持續多久,而這也是懸在Scale AI頭上的一把劍。

繼續閱讀