天天看點

解構海洋缺氧:浙大 GIS 實驗室釋出全球海表溶解氧綜合模組化架構

作者:HyperAI超神經

多年前,海洋專家 Eric Prince 在進行魚類标記追蹤時發現了一個異常現象:藍色馬林魚在美國東南部通常會下潛至 800 米的深海捕食,而在哥斯達黎加海域卻隻在海洋表層活動。作為潛水行家的馬林魚,為什麼突然不潛水了呢?長期研究長嘴魚類的 Eric Prince 決心探究這一反常現象。

其實,這是海洋生物面對海洋環境變化所作出的自我保護反應,而 Eric Prince 的這一次探究則是将其背後的「海洋缺氧」現象進一步推向大衆視野——正是由于哥斯達黎加海域的深層氧含量正在下降,缺氧區域逐漸擴大,馬林魚為了避免窒息隻得在表層活動。

人們通常将因缺氧而導緻大量海洋生物死亡的區域稱為海洋「死亡地帶」,但事實上,海洋缺氧帶來的負面影響不僅僅隻針對海洋生物本身,還會波及到漁業、乃至社會經濟。現如今,随着全球環境問題的加劇,海洋缺氧也愈演愈烈。

2019 年,世界自然保護聯盟 (IUCN) 曾在海洋缺氧報告中表明,目前低氧濃度的海洋區域正在擴大,相較于上世紀 60 年代的 45 個缺氧海域地帶,目前已增加了 600 多個受低氧條件影響的區域。報告指出,在同一時期,全球海洋中缺氧水域的數量增長了 4 倍。

為了更好地維護海洋生态系統健康、保護漁業資源,開展科學的海洋溶解氧水準測定至關重要。

然而,目前海洋實地觀測的成本昂貴,現有觀測資料空間分布不均勻,加之溶解氧濃度的測量手段多樣,所得資料的品質也存在較大差異,這都給研究全球海洋的溶解氧水準變化帶來了一定的挑戰。

對此,來自浙大 GIS 實驗室的研究人員提出了一種新的方法,将機器學習技術與衛星産品相結合,開發了一個全球海表溶解氧綜合模組化架構 DOsurface-Pred Framework,并基于該架構生成了一個跨越 2010 年-2018 年的大規模海表溶解氧資料集 SSDO。研究結果表明了即使在氧氣充足的海表區域,其溶解氧含量也出現了下降趨勢,而這種下降主要歸因于海表溫度 (SST) 的變化。

研究亮點:

* 提出了一個全球海表溶解氧綜合模組化架構

* 引入 SHAP 解釋器,确定了關鍵變量及其對預測溶解氧結果的影響

* 有助于了解全球海洋溶解氧的高動态變化、探索脫氧現象規律及其成因

解構海洋缺氧:浙大 GIS 實驗室釋出全球海表溶解氧綜合模組化架構

論文位址:

https://pubs.acs.org/doi/10.1021/acs.est.3c08833

SSDO 資料集位址:

https://go.hyper.ai/BBlqA

關注公衆号,背景回複「海表溶解氧」擷取完整 PDF

資料集:衛星 + 現場測量資料

本研究使用的資料包括衛星資料、固定船隻和電導儀現場測量資料。

衛星資料集包括海表溫度 (SST)、海表鹽度 (SSS)、葉綠素-a (Chl-a)、海表風 (SSW) 和海平面異常 (SLA)。SST 資料來自 OISST 資料集,SSS 資料來自歐洲空間局 (ESA) 的 CCI 項目,Chl-a 資料來自 MODIS Aqua 和 Terra 衛星,SSW 資料由 VAM 方法結合跨平台交叉校準的多衛星微波風和儀器觀測而來,SLA 資料來自 AVISO 項目。

固定船隻和電導儀現場測量資料來自 2018 年世界海洋資料庫 (WOD) 中的海洋站資料 (OSD) 和高分辨率導電-溫度-深度 (CTD) 子資料庫。

本研究使用的現場測量資料如圖所示,共計 28,044 條記錄,其中包含了 241 條來自 2019 年的記錄資料。

解構海洋缺氧:浙大 GIS 實驗室釋出全球海表溶解氧綜合模組化架構

現場測量的資料分布和資料相關性分析

(a) 現場測量資料的空間分布

(b) 現場測量資料的時間分布

(c) 不同海洋現場測量的資料分布

(d) 7 個主要海洋水文變量之間的相關性矩陣分析

模型構架:DOsurface-Pred Framework 的三大組成部分

解構海洋缺氧:浙大 GIS 實驗室釋出全球海表溶解氧綜合模組化架構

全球海洋溶解氧的可解釋時空機器學習架構

研究人員提出了一種時空資訊嵌入的可解釋機器學習架構。該架構由三個主要部分組成:Spatio-temporal Information Embedding Module、Backbone Regression Module 和 SHAP Explainer Module。

第一部分,用多個衛星和現場測量的時空資訊資料,即樣本 Xi= {Xi spatial,

Xi temporal, Xi satellite1, ……, Xi satellite n} 作為輸入。通過時空資訊嵌入子產品,将空間和月份資訊轉換為極坐标表示,轉換後得到 X'i={X'i spatial, X'i temporal, X'i satellite1, ……, X'i satellite n} 的全局表示。

随後,X'i 被傳遞到第二部分。用多步網格搜尋交叉驗證 (gridsearch cross-validation) 對不同模型進行評估。

解構海洋缺氧:浙大 GIS 實驗室釋出全球海表溶解氧綜合模組化架構

不同模型性能評價表

上表是 backbone models 的性能評價表,與未采用此架構的模型相比,DOsurface-Pred 架構的性能得到了提升。

此外,所有基于樹形結構的機器學習模型 (tree-based machine-learning models) 在性能上均優于 benchmark 多元線性回歸模型(multiple linear regression model)。這些模型按性能降序排列如下:ET、RF、GBDT、XGBoost、MLP。其中,ET 模型在所有評估名額上表現最佳,RMSE 值 為 11.67 μmol/kg,該模型在溶解氧 (DO) 模組化中具備更好的泛化能力,可以降低模型的過拟合現象。

在第三部分,研究人員利用 SHAP 可解釋性方法評估樣本特征值對模型輸出結果的影響。通過該架構,在最優模型下生成預測結果。

SHAP 可以量化不同特征值對預測結果的貢獻程度,使模型的輸出更容易了解,進而确定關鍵變量及其對溶解氧預測結果的影響。

實驗結論:SST 是影響海表溶解氧含量的主要原因

DOsurface-Pred Framework 可以對全球海表溶解氧濃度進行精确評估,研究人員基于該架構生成了一個跨越 2010 年-2018 年的大規模海表溶解氧資料集,稱其為 SSDO 産品。

解構海洋缺氧:浙大 GIS 實驗室釋出全球海表溶解氧綜合模組化架構

DO 預測的不确定性估計

(a,b) 均方根誤差 (RMSE) 和偏差誤差 (biaserror)

(c,d) 不同年、月下總不确定性及其組成 (M、R、P)

為了評估最優模型生成的結果,研究人員進行了不确定性估計和時空驗證。

首先,評估 SSDO 産品的誤差和不确定性。實驗結果表明,3 種誤差(測量誤差 M、表示誤差 R 和預測誤差 P)共同造成總不确定性,其總不确定性估計為 ±13.02 μmol/kg。

解構海洋缺氧:浙大 GIS 實驗室釋出全球海表溶解氧綜合模組化架構

獨立浮标 (PFL) 測量的評估

(a) 預測值和 PFL 測量值的散點密度圖

(b) 比對的 PFL 點空間位置,序号與下面 (c-h) 提供的圖号相對應

(c-h) 每個位置氧氣異常的時間趨勢,與 PFL 測量異常值進行比較

其次,研究人員利用獨立的浮标測量資料集進一步檢驗了 SSDO 的準确性和時間序列。結果表明,預測結果與 PFL 資料庫具有良好的拟合性,R² 值為 0.86。

此外,研究人員還對不同海洋地區的長期浮标觀測位置進行了比較評估,結果表明,預測結果與浮标測量的空間變化和長期趨勢方面具備一緻性。這些評估可靠地驗證了預測結果,有助于分析它們在不同場景下的适用性。

研究人員還對 SSDO 産品進行統計分析。結果表明,SSDO 資料具備與 WOD 長期記錄資料相似的空間分布。低氧區持續擴張的影響下,海表的溶解氧水準也出現了欠飽和的現象,即使是在溶解氧充分交換的海表,其溶解氧也呈現出平均每年 0.22 μmol/kg 的下降趨勢。此外,海表溶解氧的年際變化表現出與海洋典型變化現象的相關性。

解構海洋缺氧:浙大 GIS 實驗室釋出全球海表溶解氧綜合模組化架構

溶解氧模組化因素可解釋性分析

(a) 評估全球特征平均值對模型輸出結果的影響

(b) 評估局部特征對模型輸出結果的影響

(c,d) 分析 SST 和 SSS 對模型輸出的影響

(e,f) SST 和 SSS 特征影響的空間分布

研究人員利用 SHAP 可解釋性方法,進一步揭示了溫鹽等海洋因素對海表溶解氧的驅動機制。其中,溫度 (SST) 和鹽度 (SSS) 為主要因子,對溶解氧呈現出負面影響,SST 對溶解氧水準影響最大。該評估有助于提升模組化的可靠性,為探索海洋溶解氧時空分布變化狀況與脫氧現象成因提供了可解釋的因素量化結果。

綜上,研究人員利用 DOsurface-Pred 架構生成了 SSDO 資料集,并引入 SHAP 可解釋性方法,證明了即使在氧氣充足的海表區域,其溶解氧含量也出現了下降趨勢,而這種下降主要歸因于 SST 變化。

AI 與海洋,探索未知的深海奧秘

IUCN 全球海洋和極地項目海洋科學與保護進階顧問 Dan Laffoley 曾表示,「海洋中的溶解氧濃度正在持續下降,這讓本就面臨着升溫與酸化壓力的海洋生态系統雪上加霜。」

目前,除了加速全球、全行業碳減排外,通過對海洋缺氧現象的深入研究,分析氣候影響地球生命體的重要因素,也可以讓人們對不同生物體滅絕或幸存原因有更準确的認知,進一步「對症下藥」。

在這一過程中,物聯網、AI 等新興技術的能力逐漸得到了更加深入的應用。除了上文中提到的海标溶解氧分析架構外,也有學者基于衛星遙感、無人機、浮标、聲納、水下光學等海洋資料,圍繞海洋垃圾控制、海洋多樣性保護等方面展開了研究。

例如,2019 年,聯合國環境規劃署就曾釋出了一個針對湄公河及恒河流域塑膠污染的反措施項目 CounterMEASURE,該項目利用無人機在湄公河流域拍攝航空圖像,并開發了一個識别和監測模型,用于查明湄公河流域塑膠垃圾的來源和路徑,準确率達到 83.9%。

此外,澳洲的 The Ripper Group 公司,也曾研發出了一款用無人機+機器視覺技術來識别鲨魚的産品。該産品不僅用于避免沿海地區被鲨魚打擾,對保護鲨魚生态也起到重要作用。

誠然,人類社會高居不下的碳排放已經對全球氣候、生态環境造成了嚴重影響,其中,作為地球生命的起源,海洋生态環境保護也刻不容緩,期待不久後的将來,AI 驅動的環保措施在揭開海水升溫、溶解氧濃度下降真相的同時,得以治标治本、從根源上還大海以清澄。

參考資料:

1.https://mp.weixin.qq.com/s/bUbYptqccBXC2T9dvkfOfA

2.https://www.cdstm.cn/gallery/hycx/qyzx/201909/t20190904_923957.html

3.http://www.cbcgdf.org/NewsShow/4854/10658.html

繼續閱讀