天天看點

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

作者:AITIME論道

張岸

新加坡國立大學NExT實驗室博士後,主要研究Robust & Trustable AI。

個人首頁:https://anzhang314.github.io/

01

内容簡介

可微分的因果發現方法,是從觀測資料中學習候選圖,并利用一個提前定義好的平均分數函數,評估所有的候選圖,進而學習到目标的有向無換圖(DAG)。盡管這類方法在低維線性系統中取得了巨大的成功,但其有兩個無法避免的劣勢,

其一,大部分因果發現方法需要在嚴格的模型類型和分布假設下,但由于現實世界中異構資料的廣泛存在,常見的同質性假設很容易被違反,當噪聲分布變化時,會導緻性能下降;其次據觀察,這類方法由于使用平均的分數函數,故而過度利用了更容易拟合的樣本,是以不可避免地學習了假邊。在這篇文章,我們提出了一個簡單而有效的模型架構,通過動态學習重權重評分函數(簡稱ReScore)來提高因果發現性能,其中自适應權重是根據每個樣本的重要程度定量地學習的。直覺地,我們利用雙層優化方案交替訓練一個标準DAG學習器和計算樣本的權值。具體來講,通過一個有權重的分數函數,而不是一個平均分數函數來評估候選圖,着重提高DAG學習器無法拟合的樣本的權重,降低DAG學習器容易從中提取虛假資訊的樣本的權重。我們在合成資料集和真實資料集上進行了大量實驗,充分驗證了ReScore的有效性。

同時,我們還觀察到ReScore減輕了僞邊的影響,進而使結構學習的表現得以持續而顯著的提升。最後,我們進行了理論分析,以保證ReScore線上性系統中的結構可識别性和權值自适應特性。

02

Differentiable Score-based

Causal Discovery

What is Causal Discovery?

Causal Discovery即發現因果關系,就是确定變量之間的因果關系。在這裡舉一個簡單的例子:吸煙會導緻肺癌嗎?這裡的“導緻”就在反映一種因果關系。用英文的方式解釋:A causes B,即A會因果影響B,對A值的幹預會影響B的分布。在真實事例中,這種因果關系是會更複雜的,就不再僅限于二進制的形式。

Why we need Causal Discovery?

那我們為什麼需要Causal Discovery呢?我們都知道現在的人工智能發展得非常好,而主要思想就是通過從大量的觀測資料中拟合深度學習模型,提取資料之間的相關性。但是由相關性做出的預測會存在局限性,具體來講,收集資料的過程中是無法窮盡所有現實生活中的資料的,并且世界是不斷發展的,是以training和testing是一定是會差異的。這種差異,會極大的影響人工智能模型預測的準确性,也即建構在相關性上的深度模型往往缺乏很好的泛化能力。舉一個例子,下圖中,往往獅子生活在草原中,有綠色背景,而鬣狗生活在非洲,有他們的照片更偏向于黃色背景,背景顔色和動物類型就天然有了一種隐形的相關性。當模型學習到了這種相關關系,并将背景顔色作為區分鬣狗和獅子的一個标準時,再遇到獅子在黃色草原上就會分類錯誤。一隻站在黃色草原上的獅子還是獅子,一群在綠色草原上的鬣狗也隻是鬣狗。這說明,有些不穩定的相關性不應該作為模型學習的範式,而穩定的因果關系其實蘊含了本質的核心。人是通過因果關系去認識世界的,這種因果的本質将會極大地幫助模型改善可解釋性、泛化性以及魯棒性。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

How to do Causal Discovery?

相關性并不意味着因果關系,但是相關性可以告訴我們很多資訊。如果A和B是相關的,那麼會存在3種情況:A導緻B,B導緻A,A和B共享潛在的原因。也就是說隻要有相關性,那麼他們中間一定是存在因果關系的,而我們的工作就是去挖掘這種因果關系。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

專家可以通過已有的變量假設一個因果關系圖,我們擁有的是大量的觀測資料,我們能不能将觀測資料與因果圖聯系起來,通過觀測資料得到因果關系圖呢?這就需要一定的等價性假設。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

基本的假設是,如果圖中具有可分離的性質,那麼一定暗示着在資料中包含一些條件獨立性,這就把圖和觀測資料聯系在了一起。這也自然而然地啟發了第一類因果發現方法——基于限制的因果發現,即測試資料中的條件獨立性,并找到編碼它們的有向無環圖(DAG),這種方法在理論上是漂亮的,但是又存在幾個弊端:

(1)我們現在想要考察的變量數量非常多,在這種情況下需要做的條件獨立性分析也會相應地增長,算力條件往往不允許;

(2)其次,基于限制的因果發現方法找到的是馬爾可夫等價類。

另一類方法叫基于分數的因果發現,即在嚴格的模型類型和變量分布假設下,在平均得分函數上評估候選圖,這種方法是我們這篇文章讨論的重點。現今所有的基于分數的因果發現都是采用平均分數的方式,也就是說對每一個觀測資料樣本計算損失值,然後再取平均值。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

03

ReScore–Reweighted Score Function

DAG learner overly exploits easier-to-fit samples

目前很多的深度學習模型都被應用在基于分數的因果發現之中,但是也存在着很多問題。第一個問題是DAG學習器過度利用了易于拟合的樣本,即收集到的觀測資料存在着分布不平衡的現象。現實資料中,一定會有一些樣本是少量的,非常重要,而另外一些樣本是大量的,沒有那麼重要的,這是很正常的現象。然而基于分數的因果發現方法是通過計算平均值來衡量候選圖的,這就會導緻偏向學習大量簡單的樣本而去忽視複雜的含資訊量大的樣本;第二個問題是資料來自不同的領域,噪聲分布會發生變化,具有資料異質性的特點,但是這種特點會使基于分數的因果發現中的基本假設不成立,就無法确定找到的DAG是否是目标。

Differentiable Causal Discovery Methods & Limitations

我們回到現在已有的因果發現方法來簡單地總結一下,早期是傳統的不适用深度學習的基于分數的方法和基于限制的因果發現方法的天下,2018年以來,可微分的基于分數的因果發現方法有了新的發展,提出了第一個和深度學習網絡相結合的NOTEARS。針對資料異質性的問題,近些年,研究者們提出了各式各樣的多領域因果發現方法。但是這四類方法都有一定的局限性,前三類方法都依賴于資料同質性的假設,這在現實世界中很容易違反;而第四類現有的多領域方法需要顯示的域标簽,這通常是很難擷取的資訊。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

Reweighted Score function (ReScore)

可微分的基于分數的因果發現問題可以數學表示為如下圖所示的形式:

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

如果假設我們和上帝一樣,已知樣本的重要性,那麼就可以将目标函數自然而然地改寫成如下圖所示:

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

就能更好地得到損失估計。但事實上weights是不天然存在的,那我們如何估計樣本對于某一DAG學習器的重要程度呢?

我們可以用複雜樣本挖掘的啟發式方法去學習樣本的權重!DAG學習器是容易陷于易拟合的樣本之中的,不可避免地會學習到虛假邊緣,這就說明相對不那麼容易拟合的樣本是更重要的,是以我們認為損失值越大的樣本往往更重要,需要比對一個相對更大的權重。而在每次疊代中動态的配置設定權重,可以動态的估計樣本的重要性,将不容易拟合樣本的影響擴大。基于此,我們提出了雙層優化的結構學習模型和自适應權重模型,數學表達式如下圖所示:

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

但是,在優化和推理的過程中,還需要将限制的自适應權值限制在一定的門檻值内,數學表示如下:

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

具體的算法過程如下圖所示。算法過程分為兩個部分,在外循環中,更新DAG學習器,修正權重模型;在内循環中,更新權重模型,固定DAG學習器。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

Theoretical Properties of ReScore

我們也證明了一些Rescore的理論性質,第一點是可識别性。如果可微分的基于分數的因果發現方法具有可識别的性質,那麼Rescore方法是可以繼承這種性質的。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

第二點是自适應權重的Oracle屬性,ReScore不是平等對待所有樣本,而是傾向于提高困難但資訊豐富的樣本的重要性,同時降低對更容易拟合樣本的依賴。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

Empirical Results of ReScore

Sachs是一個常用的因果發現的真實資料集,包含9個domain,第一行的Avg ranking是通過ReScore方法計算出來的,ReScore認為Index 0中的樣本最複雜,是最重要的一組,Index 3是最簡單的一組樣本。我們通過SHD和TPR的方法來驗證難樣本的重要性。我們從這9組資料中随機地去除掉500個相應group下的樣本,比如對于第一列index 3的資料,我們去除index 3中随機的500個資料,然後再剩餘的資料中用NOTEARS得到預測的DAG的準确性。如果去掉的這500個資料是重要的,那往往,準确性會極大的下降。我們發現,性能的下降程度和ReScore判斷的樣本重要程度是成正比的,也即Index 0的性能是明顯下降的,這就證明了真實資料中确實存在一些非常重要的樣本,而且ReScore判斷的樣本重要性是有一定科學性的。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

在下面的實驗中,我們在原有的SOTA方法中加入ReScore,性能上都有一定的提升,這就說明ReScore方法學習到的自适應權重是樣本重要性最真實的反映。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

為了評估ReScore是否可以通過自動識别和增加資訊樣本的權重來處理異構資料而不需要組注釋,我們将baseline+ReScore與CD-NOD和DICD進行了比較,這兩種SOTA因果發現方法依賴于域注釋并且是專門為異構資料開發的。此外,還考慮了一種稱為基線+IPS的非自适應重新權重方法,其中樣本權重與域大小成反比。具體來說,我們将整個觀察分為兩個子域。顯然,來自弱勢域的單個樣本無疑比來自優勢域的樣本提供更多資訊,進而更為重要,因為它提供了額外的洞察力來描述因果關系。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

如下圖所示,紅色和藍色代表了來自不同的域,不同顔色的點在訓練開始時混合在一起。經過内循環和外循環的多次疊代訓練,所有資料都顯示出明顯的積極趨勢,即代表性不足的樣本傾向于學習更大的權重,同時與具有相同适應度的藍點相比,來自弱勢群體的紅點逐漸被識别和挑選出來并配置設定給相對較大的權重。這充分說明了ReScore的有效性,也解釋了其在處理異構資料時的性能提升。這些結果驗證了定理2中自适應權重的性質。

幹貨!ICLR 2023 | 更穩定高效的因果發現方法-自适應權重

繼續閱讀