天天看點

特寫 | 人工智能背後的臨時工

用 10 周時間,讓你從 tensorflow 基礎入門,到搭建 cnn、自編碼、rnn、gan 等模型,并最終掌握開發的實戰技能。4 月線上開課,www.mooc.ai 現已開放預約。

雷鋒網按:我們都關注人工智能有多厲害,它們可以在圍棋、德州撲克和人臉識别上戰勝人類,但人工智能變得聰明,背後是海量資料的支撐,而且這些資料是需要标注的。因而随着人工智能的繁榮,從事資料标注的人也越來越多。wired 的這篇文章就介紹了谷歌如何雇傭人工标注 youtube 視訊來訓練 ai。本文由雷鋒網編譯。

目前,google 的 “廣告品質評估員” 已廣泛存在于全國各地。這些臨時雇員通常由外部機構代為聘請,其工作即是為 youtube 視訊過濾暴力、敏感廣告資訊。這一工作目前單憑電腦本身尚無法完成,google 現在也似乎迫切需要這些人的幫助。

youtube 每天都會出售數百萬條視訊廣告,廣告播出位置會由系統自動配置設定,是以廣告商往往不知道自己的廣告具體會在哪條視訊後播放。最近,這種 “不确定性” 令 google 大為頭疼,公司甚至是以受到相關方的審查。

google 方面則一直積極解釋,以防止輿論擴大化。在他們看來,媒體其實誇大了視訊廣告問題,目前已标記的視訊數尚未達總數的千分之一,google 首席營銷官 philipp schindler 也表示這個問題根本不足為訓。

由于 google 超過 90 %的收入都來源于廣告,是以他們也需要快速解決問題來防止廣告商撤位。但是,youtube 每天都有近 60 萬小時的新視訊上傳量,如此巨大的數量使得采用人工過濾很困難,軟體所要處理完成的标記量可謂 “前所未有”。但問題是,公司仍然需要投入人力進行 ai 訓練。是以,google 仍然依賴于人工完成廣告标記工作,以此建構好 ai 學習所需的資料。

評估員任務

技術公司會長期雇用内容管理者,這項工作也随着人們上傳和分享量的增加而變得越來越重要。有廣告評估員說,他們的角色不僅僅在于監控視訊,他們會閱讀評論,标記使用者之間的濫用行為;會檢查 google 提供的各種網站,確定符合公司标準;也會按類别進行網站分類,點選廣告連結檢視狀态正常與否。

具體而言,某些情況下評估員們需要在不到兩分鐘内檢視幾小時長的影片,這就意味着這份工作更強調數量和速度。此外,他們也不僅隻是将視訊簡單标記為不合适——從标題到内容,他們都需要進行細緻的評估并進行分類。存在評估内容與既定已有類别不比對的情況時,他們會将材料标記為 “不可評估類”。

也多名廣告評估員說,公司要求他們觀看内容震撼的視訊,比如有人試圖在車上殺自己的狗——視訊中的人放火燒了自己的車,然後走出來以一槍結束了自己的生命。此外,還有人會看暴力侵害婦女兒童和動物的視訊。其實評價員們并不知道 google 是如何進行視訊任務選取與下達的 - 他們隻有在開始工作的才能看到視訊的标題和縮略圖。

總而言之,google 仍然需要人力來協助處理 youtube 的廣告問題。公司高管和代表們也一再強調,隻有機器智能才能解決 youtube 中的規模化任務問題,但是在 google 機器或其他任何人都能夠自覺識别不宜言論之前,這樣的工作仍然需要依賴人去完成。

google 發言人 chi hea cho 說:“我們一直将技術與人類評論結合進行綜合分析已被标記的内容,因為對于視訊的了解是很主觀的。最近我們也增加人力加快評估速度,這些評論有助于我們完善算法很有幫助。”

評估員來源

據悉,廣告品質評估員這一工作開始于 2004 年。雇傭機構的始祖是 abe,他們會付給大家每小時 20 美元的薪水,但是 2006 年 workforcelogic 收購了 abe 之後,評估員工作條件就不如從前了。2012 年,一家名為 zerochaos 的公司收購 workforcelogic,如今則采取合同制方式進行人員雇傭。

廣告評估員可以随時随地工作,滿足每周 10 小時的最低工作要求即可。隻是這項工作不是那麼穩定,雖然大多數人都蠻喜歡這份工作,但他們幾乎沒有機會成為永久的全職員工。

本次調查的廣告評估員都是通過 zerochaos 聘用的,大家每小時賺取 15 美元,每周最多可以工作 29 個小時。如果每周工作時長達到 25 個小時,則可申請福利,但是想達到這個工作量可以說相當困難。有人說他們會面臨毫無預兆就被解雇的情況,公司一封電子郵件,你們的勞務關系就終止了。

實際上由于無法與 google 直接進行明确的溝通,評估者對這份工作會産生不安全感。谷歌隻會給評估員一個通用郵箱用于工作方面的聯系,并且采用自動回複方式回答大家的郵件。也就是說,google 會告訴評估員他們所做的工作相當重要,也會非常重視工作成果評估,但他們并不會給出詳細說明解釋原因。

google 會将已審查的内容整合到廣告評估員的任務中用以績效衡量。這些測試内容會通過郵件的方式混雜在日常任務中一起發給評估員們,并以最終成績來評估大家的表現,沒有通過測試的人會面臨解雇危險。

即使如此,每小時 15 美元的酬勞仍然高于大多數城市的最低工資。會有人很高興 zerochaos 給他的工作機會。

評估員與 ai

跨技術行業的大公司雇用臨時員工參加用于教育訓練 ai 系統的重複任務。一位廣告評估員曾在幾年前參與評估了 microsoft bing 的搜尋結果,他們每人每小時要浏覽多達 80 頁的搜尋結果。linkedin 和 facebook 也會通過進行類似的任務測試。

臨時性工作所帶來的安全感的缺乏和廣泛存在的短期合同工,使得現任和之前的雇員們感到不安,他們認為,google 正在漸漸失去系統知識和經驗,這些東西原本為那些工作上投入了更多時間的雇員所掌握。他們花時間花時間訓練新人,接着又把他們掃地出門,實在是浪費時間。

但是,通過人類廣告評估員也許會找到能夠使 ai 更為聰明的最佳做法。ai 需要許多内容輸入,特别是一些令人反感的内容,是以定期輸入教育訓練人員資料更适合于訓練 ai。為機器輸入更為多元的資訊,結果自然會更好。

另一方面,ai 研究人員普遍認為,不良的人類習氣不一定會影響機器學習,反而可能會由于特别工作環境和經驗而産生更微妙的影響。康奈爾大學 ai 教授 bart selman 說:“人們通常的觀點是訓連 ai 模型需要大量的資訊輸入。這種觀點适用于一般情況,但涉及道德判斷時,我們就要考慮到大多群體中會存在明顯的根深蒂固的偏見的,人們認為男性會比女性更好的勝任某些工作就是明證。是以,如果你是通過一般性或以往的資訊輸入訓練 ai,那麼必然也會受這些資訊中所隐藏偏見的影響。”

“你應該不想用那些普通人的日常做法來訓練 ai 的道德吧,那些對于潛在的偏見和倫理問題有着更為深入、仔細思考的想法才是你所想要的資訊輸入。”selman 說。

google 員工在 mountain view 總部享有絕佳的環境,而典型的廣告評估員的生活卻與之相差甚遠。為世界上最有價值的科技公司工作意味着享有優渥的福利和極高的薪水,但也可能意味着作為臨時工作者,你僅僅是在教育訓練這些公司的機器做同樣的工作。

<a target="_blank">本文來源于"中國人工智能學會",原文發表時間" 2017-04-26  "</a>

繼續閱讀