天天看點

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

近日,斯坦福大學釋出了《人工智能指數2022》(Artificial Intelligence Index Report 2022)報告。這是斯坦福大學連續第五年釋出人工智能領域的報告,今年的報告中,中國在相關期刊出版和引用量上均名列第一。

報告還指出,随着人工智能系統,如自然語言處理、圖檔識别等技術的能力正在迅速增強,它們存在等偏見和有害性也在增強,這促進了各國對于倫理和法律領域的建設,5年間有25個國家通過了55項與 智能相關的法案。

中國釋出最多論文,中美合著數量居世界首位

在人工智能快速發展的背後,研發力量不可或缺。從2010年到2021年,人工智能出版物的總量翻了一番,從16萬篇增長到33萬篇,其中包括期刊文章、會議論文和學術論文等。

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

其中,模式識别和機器學習方 的出版物增速較快,自2015年以來總數亦已翻倍。與此相對的是其他受深度學習影響較 的領域增幅較小,其中包括計算機視覺、資料挖掘和自然語言處理等領域。

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

從地區來看,2021年,東亞和太平洋地區以42.9%的期刊發文量領先,其次是歐洲和中亞(22.7%)和北美(15.6%)。此外,南亞、中東和北非的增 最為顯着,在過去12年中,它們的AI期刊出版物數量分别增長了約12倍和7倍。

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

而中國則保持着其在論文數量上的領先位置。自2010年開始,中國就常年占據論文數量的第一。去年,中國在人工智能期刊、會議和知識庫的出版物貢獻數量方面繼續世界領先——所有三種出版物類型的總和比美國高出63.2%。與此同時,期刊論文引用率也以27.84%居于世界首位。

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍
AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

值得注意的是,盡管地緣政治緊張局勢加劇,但自2010年至2021年的11年間,中美合作的跨國人工智能出版物最多,且自 2010年以來增加了五倍。中美合作的出版物數量是該項排名第二的中英合作出版物數量的2.7 倍。

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

大型語言模型更易反映偏見,倫理監管需跟上

自然語言處理(Natural Language Processing,NLP)在今年的報告中的資料表現并不十分亮眼,但報告着重指出了其訓練資料中存在的偏見(bias)問題。

資料顯示,大型語言模型更能從訓練資料中反映出偏見。2021年開發的、包含2800億參數的自然語言模型相較于2018年包含1.17億參數的模型而言,有害性(toxicity)增加了29%。這一現象在多個公開語料網站上非常常見,語言模型的有害性很大程度上來自于未過濾的底層訓練資料。

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

機器翻譯系統也被證明其資料集反映、放大了社會偏見。斯坦福大學采用了WinoMT的基準資料,當英文語句被翻譯成其他語言時,這些模型通過比較原文和翻譯後的性别代稱,如是否會将“she”翻譯成“他”或将“he”翻譯成“她”,來衡量機器翻譯中的偏差。

資料結果證明在大部分測試語言中,男性性别翻譯的準确性都稍高于女性性别。

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

除此之外,多模态模型學習中的偏見也引起了研究人員的注意。近年來,多模态語言視覺模型方面取得了快速進展,創下諸多有關圖像分類、從文本中建立圖像等任務的新記錄,與此同時,它們也反映出社會刻闆印象和偏見,報告中指出,黑人的圖像被錯誤分類為非人類的比率是任何其他種族的兩倍多。

令人欣慰的是,關于人工智能透明性和公平性的研究也從2014年開始爆炸式增長。與人工智能倫理相關的出版物增加了五倍有餘。工業界研究人員近年來在人工智能倫理會議中釋出的出版物同比增長71%。除此之外,自動事實核查資料集從2010年開始逐年增長,在2021年新增了25個,其中包含了12個非英文資料集。

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

倫理之外,各個國家也在人工智能的法律治理上加大力量。從2016年到2021年, 共有25個國家通過了55項與 智能相關的法案,其中美國占據榜首。從2017年開始,美國每年都有三項新法案通過,至今已釋出了13項法案。緊随美國之後的是俄羅斯、 利時、西班 和英國。而2021年頒布的法律數量上,西班牙、英國和美國領先,各釋出了三項。

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

這并不意味着其他的國家無意對人工智能進行管理。報告中提及,在2021年統計的25個國家的立法程式中,共計有1323次提及人工智能。其中西班牙、英國、美國、澳洲和日本名列前矛。

AI報告:機器翻譯放大社會偏見,全球倫理相關出版物增五倍

繼續閱讀