導語
社會和自然界中的極端事件,如疫情高峰期、航行中的異常巨浪或複雜系統的結構性故障,都可能引發災難性的後果。預測極端事件非常困難,因為它們很少發生,從看似良性但往往是未知的複雜無限維系統中産生。這些挑戰使描述它們的嘗試變得毫無意義。在近日發表于Nature Computational Science 的最新研究中,麻省理工學院和布朗大學的研究人員開發了一個機器學習架構(DeepOnet),無論初始資料的狀态如何(即有無極端事件),都能發現極端事件,并且優于現有的算法。這個架構構成了一個可擴充的人工智能(AI)輔助的實驗基礎設施,可以有效推斷和确定從實體到社會系統等許多領域的臨界情況。
關鍵詞:機器學習,極端事件預測
論文題目:
Discovering and forecasting extreme events via active learning in neural operators
論文連結:
https://www.nature.com/articles/s43588-022-00376-0
在預測極端事件帶來的災難(如地震、流行病或可能摧毀沿海結構的“異常巨浪”)時,計算模型面臨着一個幾乎無法克服的挑戰:從統計學上講,這些事件是如此罕見,以至于沒有足夠的資料來使用預測模型,以準确預測它們下一次發生的時間。但是來自布朗大學和麻省理工學院的一組研究人員開發了一種機器學習算法架構,嘗試應對這種挑戰。
發表于 Nature Computational Science 的一項新研究中,科學家們描述了他們如何将統計算法與機器學習技術相結合——這種算法隻需要更少的資料就能做出準确、有效的預測。新的架構可以提供一種方法來規避傳統上用于這類計算任務所必需的海量資料,将預測罕見事件的挑戰從本質上歸結為定性而非定量問題。盡管缺乏有關罕見事件的曆史記錄,但他們訓練這種機器學習技術可以用來預測極端事件發生的場景、機率,有時甚至預測罕見事件的時間。
圖1. 将該架構用于各種極端現象的推斷,從大流行病的高峰(a)到危險的異常巨浪(b)。
預測罕見的極端事件需要解決的問題是,什麼是可以使用的最佳資料,以盡量減少需要的資料點的數量?研究人員通過一種叫做主動學習的順序抽樣技術找到了答案。這些類型的統計算法不僅能夠分析輸入的資料,更重要的是,它們能夠從資訊中學習标記新的相關資料點,這些資料點對于正在計算的結果同樣重要,甚至更重要。在最基本的層面上,他們允許用更少的資源做更多的事情。
本質上,研究人員希望能找到這樣一種方法,它不僅能夠準确地推廣到無限維系統,輕松地随資料大小擴充,進行不确定性估計,并應用适當定義的采集函數來選擇極端資料。是以,在研究中使用的機器學習模型至關重要。研究人員開發了一個名為 DeepOnet 的模型是一種人工神經網絡,它使用多個連續的層中互相連接配接的節點,大緻模拟人腦中神經元的連接配接。DeepOnet 被稱為深度神經操作器(deep neural operator, DNO)。它比典型的人工神經網絡更先進,更強大,因為它實際上将兩個神經網絡合二為一,在兩個并行網絡中處理資料。這使得它能夠以極快的速度分析大量的資料和場景,一旦它知道自己在尋找什麼,就能夠産生出同樣大小的機率集。
這個強大的工具的瓶頸,是深層神經操作器需要大量的資料進行訓練,以便進行有效和準确的計算。這對于涉及到極端事件時,尤為嚴重。
該研究小組在論文中表示,DeepOnet 模型可以結合主動學習(Active learning)技術得到訓練,了解哪些參數或前兆會導緻目前正在分析的災難性事件,即使資料點不多。
圖2. 發現并量化極端事件機率的架構。
高效穩健的 DNO+BED 架構,用于發現和量化極值。該架構具有 DNO 和罕見事件擷取功能,用于發現極端情況。用一組觀察到的實體輸入-輸出對進行初始化,保留其功能形式。(i) 将函數傳遞給 DNO 的集合,以學習基礎系統的稀疏表示。(ii) 對 DNO 函數空間進行快速的蒙特卡洛搜尋,以尋找極端值。(iii) 計算蒙特卡洛集合的統計資料,并選擇既能探索又能利用極端空間的新輸入函數。(iv) 在基礎實驗或模拟上評估拟議的輸入,記錄輸出(QoIs)并傳遞到(i)。重複(i)-(iv),直到統計資料收斂或資源耗盡。以支援預測極端事件的最佳訓練的 DNO 結束。
作者指出,重點不在于擷取所有可能的資料并将其輸入系統,而在于積極主動地尋找那些意味着罕見事件的事件。真實事件的例子可能不多,但卻可以捕捉那些先兆。可以通過數學識别它們,再加上真實事件,将有助于訓練對資料饑渴的深度神經操作器。
在論文中,研究人員應用這種方法來精确定位大流行期間危險尖峰的參數、處在不同範圍的機率、發現和預測巨浪的發生,以及估計船舶何時會因壓力而裂成兩半。例如,對于巨浪——那些大于周圍波大小兩倍的海浪——研究人員發現,他們可以通過觀察随時間非線性互相作用的可能波形條件,發現和量化巨浪的形成時間,這些非線性作用可能會導緻原有波浪三倍大小的波浪。
研究人員發現他們的新方法比傳統的模組化方法更有效率,他們相信它提供了一個能夠有效發現和預測各種罕見事件的架構。
在論文中,研究小組概述了科學家應該如何設計未來的實驗,以便他們能夠最小化成本和提高預測的準确性。例如,來自布朗大學的數學家已經在與環境科學家合作,使用這種新穎的方法來預測飓風等氣候事件。
Brown University | 來源
郭瑞東 | 譯者
劉志航 | 審校
鄧一雪 | 編輯
商務合作及投稿轉載|[email protected]
◆ ◆ ◆
搜尋公衆号:集智俱樂部
加入“沒有圍牆的研究所”
讓蘋果砸得更猛烈些吧!