EMNLP最佳長論文作者獨家解讀：别讓機器學習放大性别偏見，其實男人也喜歡購物！

近日，自然語言處理領域頂級國際會議 EMNLP 于丹麥哥本哈根舉行。EMNLP是自然語言處理三大頂級會議（ACL, EMNLP, NAACL）之一，已經于前段時間公布了錄用論文及最佳論文名單。詳情可參見雷鋒網(公衆号：雷鋒網)AI科技評論此前文章：

萬字長文，深度解讀11篇 EMNLP 2017 被錄用論文

EMNLP 2017 最佳論文揭曉，「男人也愛逛商場」獲最佳長論文

其中，弗吉尼亞大學趙潔玉、王天露、Vincente Ordonez、張凱崴及華盛頓大學的 Mark Yatskar 憑借「Men Also Like Shopping: Reducing Gender Bias Amplification using Corpus-level Constraints」摘得最佳長論文。雷鋒網AI科技評論邀請了第一作者趙潔玉對此論文做了獨家解讀。

原文位址：https://arxiv.org/abs/1707.09457

概要

包含語言的視覺識别的任務，例如圖檔标題标注，視覺問答系統以及視覺語義角色标注任務已經成為從圖檔中擷取資訊的不同途徑。這些任務通常依賴于大量的資料集、結構化的預測方法以及深度學習提取圖檔及語言中的豐富資訊并以此解決這類問題。其中結構化的預測方法允許機器學習模型用标注之間的關系來提升預測的準确度。例如視覺語義角色标注任務（vSRL），需要對給定圖檔中所展示的動詞以及與該動詞相關的幾個角色（工具，地點等）值進行預測。例如在圖1中，考慮到鏟子是一種常見的烹饪工具，結構化的預測模型會有很高的幾率将“tool”預測為“spatula”。

圖1

盡管結構化的預測方法可以為我們提供較好的預測結果，但是這類方法會學習到資料集中存在的偏差 (bias)。如果不對模型進行修改限定，此類模型會做出具有偏見的預測。例如在上圖中，模型從資料集中學習到女性與做飯之間的聯系，即便給定一張描述男性做飯的圖檔（1.4），模型仍然會預測其為女性。這種将女性與做飯之間聯系更緊密的情況，反映了一種社會成見，對不同的性别均有不良的影響。

在本文中，我們針對男女兩個性别進行研究，通過實驗發現，模型不僅會學習到資料集中的偏差，并且會放大該偏差。我們提出了RBA算法用于解決被放大的偏差，并且驗證了我們的算法可以有效的減少放大的bias同時幾乎保持了原有的模型性能。

我們針對以下兩個任務進行研究：基于imSitu資料集的視覺語義角色标注(vSRL)任務以及基于COCO資料集的多标簽物體識别(MLC)任務。本文中将以vSRL（如上圖1）為例進行解釋。該任務的目标在于預測所給定圖檔中的動詞，以及圖檔中的其它角色。

在研究模型放大偏差的過程中，我們定義了測量集合以及屬性集合。前者包含了所能預測的動詞，比如cooking，washing等；後者則是一些人口特征，例如性别，年齡等。我們定義針對某動詞的性别比例，該比例取值[0,1]，越接近于1，表明該動詞越傾向于男性。

我們也定義了如何計算放大的bias。例如在訓練集中，cooking的性别比例為33%，偏向于女性，但是在預測結果中，該比例變成了16%，表明這種bias被放大了17%。實驗結果如下圖2所示：不同的動詞對不同的性别表現出不同的偏見程度。例如上文所提到的cooking更傾向于女性，此外“購物”，“洗衣”等都更偏向于女性；“駕駛”，“射擊”以及“指導”則更偏向于男性。分析結果表明在vSRL任務中，所有動詞平均放大的bias率為5%，在MLC任務中，該值為3%。

圖2

對模型的修訂

驗證了模型對bias的放大作用後，我們提出了RBA算法對模型進行修訂以減少所放大的偏差。我們先從訓練集中擷取每個動詞的性别比例作為參考标準，并以此限制預測的結果，即每個動詞預測的性别比例應當在相應參考标準的特定範圍内。通過引入這些限制條件，我們将原有的模型變成一種具有限制的預測模型。

我們提出利用拉格朗日松弛方法對此類模型求解，該方法的優點在于我們可以利用原有的預測方法而不必重新構造算法訓練模型，并且在所有限制條件均滿足的情況下，該算法可以保證達到最優解。具體來說，我們對每一個限制條件設定了一個拉格朗日算子，循環地根據目前的預測結果更新所有的算子，根據這些新的拉格朗日算子來更新預測算法所利用的因子值，進而可以得到新的預測結果。當所有的限制條件均滿足或者已經循環了足夠多的次數後，算法停止。

實驗結果（圖3）表明我們的算法可以有效的減少放大的偏見，并且不失原有模型的準确度。具體來說，在vSRL中，我們減少了40.5%的平均放大bias值，在MLC任務中，該值為47.5%。在準确度上，兩個模型幾乎保留了原有的準确度，應用算法前後隻有0.1%的差距。

Bias on vSRL without RBA Bias on vSRL with RBA

圖3 算法在vSRL資料集上的結果

本文作者：奕欣

EMNLP最佳長論文作者獨家解讀：别讓機器學習放大性别偏見，其實男人也喜歡購物！

繼續閱讀

Codeforces 1417 D. Make Them Equal(思維+構造)

查找算法之二分查找查找算法之二分查找

查找算法學習之二分查找（Python版本）——BinarySearch

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希