ChatGPT标注資料比人類便宜20倍，80％任務上占優勢

Pine 發自凹非寺

量子位 | 公衆号 QbitAI

又一“人類飯碗”被AI搶走，還是和訓練AI息息相關的：

資料标注。

蘇黎世大學研究發現，在ChatGPT面前，無論成本還是效率，人類可以說是毫無優勢：

成本上，ChatGPT平均每個标注成本低于0.003美元，比衆包平台便宜20倍；

效率上，在相關性、立場、主題等任務中，ChatGPT也是以4:1的優勢“碾壓”人類。

論文發出後，有網友調侃，“生成訓練資料需要人工”的說法已經成為過去式了。

還有人直呼“古籍修複數字化工作是不是有希望提速了”。

還有人看熱鬧不嫌事大，直接發推稱：

這是直接端了平台工作者的飯碗。

話說回來，ChatGPT是怎麼搶了資料标注工作者的“飯碗”的？

ChatGPT在80%任務上占優勢

首先得先了解下資料标注工作的具體内容。

簡單來講，資料标注就是給社交媒體上的内容資料貼标簽，将其以不同主題或者概念進行分類，或是對其立場以及情緒進行判别。

這些經過标注的資料就可以用作NLP模型的訓練集或是評估标準。

以往，這類工作都是交由人工處理的，比如說MTurk就是專門進行資料标注的一個衆包平台。

在MTurk這類衆包平台内部，還會有更加精細的分工，比如說會有經過專業訓練的資料标注者以及衆包工作者。

前者在産出高品質資料上具有優勢，但自然成本也更高，而後者雖然更便宜但品質也會随任務難度波動。

于是研究團隊就開始着手研究大語言模型（LLM）在這方面的潛力，并且對比了沒有額外訓練（zero-shot）的ChatGPT（基于GPT-3.5）和MTurk在資料标注上的性能。

這項對比基于研究團隊此前收集到的2382條推文樣本。

ChatGPT和MTurk分别将推文以“相關性、立場、主題、政策、實用性”這五種任務進行标注。

評估的标準有兩條：

準确性：ChatGPT和MTurk衆包工作者相較于正确标注的百分比；

編碼者間的一緻性信度：用ChatGPT、MTurk衆包工作者以及專業資料标注者任意二者之間的一緻性來計算；

結果呢也顯而易見，在準确性上，ChatGPT有五分之四的任務都要優于MTurk衆包工作者。

在一緻性信度上，ChatGPT全部任務都超過了專業資料标注者。

成本方面，開頭也已經提過，ChatGPT平均每條比人工便宜20倍，何況AI還能24*7無休。

不過對于研究團隊得出的這個結論并不是所有網友都買賬，有人表示：

這五條任務都太單一了，難度也是。僅憑這一點就得出這樣的結論可靠性存疑。

甚至還有網友嘲諷了起研究樣本太少來：

（竟然）隻用2382條推文做樣本。

“飯碗威脅”不止資料标注

現在，AI會不會完全取代某一類工作還不好說，但它會在一定程度上影響人類工作是毋庸置疑的。

上周，OpenAI就釋出過一份分析報告，稱有80%的工作都會在一定程度上受到ChatGPT的影響，19%的崗位會受到ChatGPT的嚴重沖擊。

并且薪資越高的職業受到的沖擊就越大。

OpenAI還進一步列出了會被影響的具體職業，從大到小依次是：

翻譯從業者、文字創作者（包括詩人、作家等）、公關人員、數學家、稅務編制人員、區塊鍊工程師、财務工作者、媒體從業者……

除此之外，OpenAI的CEO奧特曼也不止在一個場合下說過“AI會取代現有的部分工作”。

前不久，MidjourneyV5大更新也是讓不少人類畫師直呼飯碗不保。

emmmmmm，你覺得你的飯碗還保得住嗎？

論文位址：

https://arxiv.org/abs/2303.15056

參考連結：

https://twitter.com/arankomatsuzaki/status/1640521970608402435

ChatGPT标注資料比人類便宜20倍，80％任務上占優勢

繼續閱讀

『點亮生命綻放光芒』熒光技能學術交流-東區預選十強名單公布！

看直播搶好禮丨5.1『如e雲車展』轉發搶答、預約試駕領精美禮品

唯有主動追求的東西才能到手

有自戀特征的人“永遠不會”做這6件事！

全球首富馬斯克貢獻了一部震撼世界的超級大片！

不被大風吹倒！莫言寫給青年朋友的一封信刷屏！網友：直抵人心

頭皮屑又多又油？教你3個洗頭妙招，頭皮屑不再像“下雪”！

微信視訊号，放量視訊帶貨？

不止蓋泡面，閑置 Kindle的6 種花樣用法

“四周年”活動即将上線海量好禮等您來拿！

《公衆号圖文橫屏旋轉提示設計大全》

我删除了無數公衆号，卻留下了這幾個丨薦号

破案了！百萬使用者與AI交友，背後果然有大模型

環保項目被指涉嫌大規模污染自然保護區，螞蟻森林回應

滬上知名連鎖餐廳，給寶寶的肉餡竟然是生的？網友：還不許自帶食物