天天看點

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

作者:生物多樣性與系統發育
北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

北美蝴蝶空間系統發育與環境因素及植物多樣性相關性研究

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

對昆蟲生物多樣性及其形成因素的大規模定量評估仍未得到充分探索。在此,我們對北美蝴蝶進行了空間系統發育分析,以測試氣候穩定性和溫度梯 度是否塑造了它們的多樣性和地方性。我們還對蝴蝶和開花植物之間的空間系統發育模式進行了首次定量比較。發現蝴蝶的生物多樣性模式與開花植物顯著不同,特别是在溫暖的沙漠中,與開花植物相比,蝴蝶表現出不同的系統發育聚類模式,這表明兩組動物在 栖息地保護方面存在差異。這些結果表明,共享的生物地理曆史和營養關聯并不一定保證相似的多樣性結果。這項工作在保護規劃中具有應用價值。

在陸地生物多樣性加速下降的情況下,快速擴大昆蟲生物多樣性知識庫并保護它的一種方法(van Klink et al.,2020)在于關注現有數 據已經密集但尚未完全整合的分支。這樣的努力也為與其他譜系的直接、實證比較提供了獨特的基礎。蝴蝶(鳳蝶科) 因充滿活力以及其豔麗的 顔色成為研究人員和博物學家的理想研究群體,它們不僅是被 收集和拍攝最多的昆蟲(Scoble, 1995),而且許多種類和分支的蝴蝶已經成為研究不同生态和進化過程的模型,例如貝氏和穆勒氏拟态(例如,Heliconius屬的蝴蝶(Brower, 1996;Kronforst and Papa, 2015;Lewis et al., 2019)),遺傳和遷移(例如,Danaus 屬的蝴蝶),以及對農業系統的适應(例如,常見和廣泛的卷心菜 白,Pieris rapae (Shen et al.,2016)),遺傳和遷移,蝴蝶是世界自然保護聯盟等保 護機構對物種瀕危狀态進行初步評估的少數昆蟲類群之一(Bonelli et al.,2018)。

北美大約有 1900 種蝴蝶(Lotts 和 Naberhaus,2017 年),自然史和基因資料顯示有近 1500 種蝴蝶。這些強大的數 據源使我們能夠超越簡單的多樣性分類總結,例如物種豐富度,并朝着更全面的、以過程為導向的了解 多樣性在大陸尺度上是如何進化結構的。盡管有這樣的潛力,對蝴蝶(或任何其他昆蟲類群)以及這種多 樣性的驅動因素進行綜合的、廣泛的系統多樣性分析還有待進行。甚至北美範圍内對蝴蝶類群多樣性的 總結也很有限(Ricketts et al.,1999;Kocher and Williams, 2000;路易斯-馬丁内斯等人,2002)。

蝴蝶對氣候變化很敏感(Dennis, 1993),一個基本的問題是,目前的氣候和曆史上北美溫度和景觀的變化 是如何塑造蝴蝶的系統發育多樣性和地方性的。北美具有廣泛的生态系統、動态的地質曆史和重要的昆 蟲多樣性(Danks, 1994;Godfray et al.,2000)。蝴蝶分布在 14個廣泛的生态區,從東部溫帶森林到加拿大 北部的苔原和針葉林,墨西哥南部的熱帶潮濕森林,以及西南的溫暖和寒冷的沙漠(Lotts 和 Naberhaus, 2017)。由于長期的幹旱化和造山運動導緻内華達山脈的形成,整個大陸的景觀在第四紀期間發生了巨大 的變化,特别是在西部,并且通過冰川的循環模式橫跨大陸的北部部分(Bintanja 和 van de Wal, 2008)。

蝴蝶也嚴重依賴開花植物,作為成蟲花蜜和幼蟲食物的來源(Bronstein et al., 2006)。一個關鍵的問題是, 考慮到這些強烈的生态關聯和共同的曆史景觀和氣候驅動因素,蝴蝶和被子植物是否表現出和諧的廣泛 生物地理模式。最近記錄北美植物系統多樣性的努力(Mishler et al.,2020)為蝴蝶與被子植物的直接、 定量比較提供了資料基礎。最近的分析是迄今為止最全面的嘗試,涵蓋了整個大陸發現的 19,500 多種 植物物種(總物種超過 44,000 種)。這項研究首次在大陸尺度上直接比較了任何一組昆蟲和開花植物之間 的系統發育多樣性的空間模式和驅動因素。

在此,我們收集和分析了北美蝴蝶的空間系統發育多樣性,并研究了它與曆史氣候和開花植物系統 發育多樣性模式的關系。與傳統的分類方法相比,系統發育方法有兩個關鍵優勢。首先,系統多樣 性名額減少了對物種定義的依賴;相反,分支長度被用來計算多樣性名額。其次,空間系統發育方法 引入了進化史,并允許假設檢驗,進而有可能評估,例如,群落之間的親緣關系是比偶然預期的更 遙遠還是更緊密。

我們應用了一套空間系統發育方法和名額,包括系統發育多樣性(PD) (Faith, 1992)、系統發育地方性 (PE) (Rosauer 等,2009)和相對系統發育多樣性和地方性(RPD 和 RPE)(Mishler 等人,2014)。我們還使 用了 CANAPE,它可以區分在一個地區發現的地方性類型(Mishler 等人,2014),即在導緻新地方性的 近期輻射和導緻範圍受限群體的遺迹地方性之間,這些群體曾經更加廣泛,即古地方性。雖然這些名額 現在被普遍應用,但我們在表 1 中對這裡使用的名額做了一個簡短的總結。我們使用這些系統發育多樣性和地方性的名額來測試關于一系列潛在驅動因素和關聯的假設,包括蝴蝶 和開花植物之間獨特的、直接的經驗比較。這些相同的技術還記錄了可能不同于植物或脊椎動物群體的 多樣性和地方性中心,并為保護優先級提供資訊。根據最近對北美植物系統多樣性的分析,我們做出了 以下預測:

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

1.随着時間的推移,更溫暖和保持更穩定的地區将具有更高的系統發育多樣性 (PD) (Rohde, 1992;Mittelbach et al.,2007)。穩定地區(無論是溫暖地區還是寒冷地區)的 PD 值應該顯著高于随 機地區,因為它們有最多的時間積累譜系(Cowling 和 Lombard, 2002 年),以及可能建構群落以避 免競争的專業化(Fine, 2015 )。

2.在最穩定的地區,相對系統發育多樣性(RPD)将高于預期,積累了更多存活時間長、年齡更大的譜系(Fine, 2015)。在北美,這包括大陸的東部和最南端,正如在開花植物中看到的那樣。地形異質 性高和氣候最不穩定的地區,如北部和西部部分地區最近的冰川消退地區,其 RPD 将顯著低于預期。

3.蝴蝶在北美的系統發育地方性将與被子植物高地方性的熱點相一緻。新特有的熱點更有可能出現 在地勢起伏較高的年輕地區,而古特有的地區則更有可能出現在氣候和景觀更加穩定的地區。

4.大陸尺度的開花植物和蝴蝶的系統多樣性模式将是一緻的,因為這兩個類群之間的共同進化動力 學以及潛在的景觀和氣候驅動因素的相似性。另一方面,蝴蝶寄主偏好的相對廣度和寄主植物數 量與整體植物多樣性相比可能會稀釋和掩蓋一緻性。

結果

北美蝴蝶的種系發生

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖1 一個由1437隻北美蝴蝶組成的時間校準樹,其中39個最深的節點(在K-Pg邊界之前)顯示了bootstrap支援

總共有1437種(74.6%)已知的蝴蝶物種已經擁有COI的序列資料或進行了從頭測序(圖1)。從頭測序添加了140個物種,其中96種(68.6%)僅分布于墨西哥。

觀察到的多樣性和地方性的模式

觀察到的物種豐富度地圖(圖2A和S2A)和系統發育多樣性地圖(圖2B和S2B)都表明,主要在墨西哥的熱帶幹濕森林中,多樣性最高,而在加拿大的北極地區,多樣性最低。相比之下,觀察到的RPD在溫帶山脈西部的大部分地區、加州的地中海地區,以及北方生态系統,如北方森林和針葉林,都較低。系統發生地方性(PE;圖2D和S2D)顯示了與PD和RPD相同的總體緯度梯度,但包括了墨西哥溫帶内華達山脈和太平洋海岸山脈沿線的系統發育特征較高的地區。

空間随機化測試

我們發現了高度區域化的過度離散模式和基于PD随機分組的聚類(圖3B)。所有北方、針葉林和苔原地區的PD均低于預期,提示存在系統發生聚集性。西部大部分溫帶地區,包括寒冷的沙漠、西海岸森林和加州地中海部分的不同生态地區,也顯示出聚集性。相比之下,與無效模型相比,北美系統多樣性最高的熱帶潮濕和幹燥森林的PD或系統發育過度分散高于預期。我們還注意到,中南部半幹旱草原的部分地區也表現出高于預期的系統多樣性。南部、溫暖沙漠和東部溫帶森林的PD值不顯著高或低。

RPD随機化表明,北美南部地區的社群中分支長度超過模型下的預期(圖4B)。這不僅包括熱帶地區也有半幹旱高地和南部沙漠變成半幹旱平原和大草原。另一方面,内華達山脈、落基山脈和山間西部的大部分地區都發現了比預期的樹枝長度短的樹枝。我們在東部溫帶森林、大平原北部和北美最北部地區沒有發現顯著的RPD。

在主要的溫暖沙漠和東南部沿海平原以及佛羅裡達州的南部亞熱帶部分以古地方性為主的遺址更罕見,僅在熱帶墨西哥的一些地區顯示。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖2 多樣性和地方性模式

北美蝴蝶的觀察值:(A)分類豐富度,(B)系統發育多樣性(PD),(C)相對系統發育多樣性(RPD)和(D)系統發育地方性(PE)。沒有對數縮放調色闆的地圖可以在圖S2中檢視。

系統多樣性的驅動因素

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

年平均溫度是預測PD最重要的環境變量,其次是年平均降水量和降水季節(表2)。溫暖和潮濕的地區通常有最高的PD。此外,高海拔地區和季節性降水較多的地區總體上具有較高的PD,但這些影響較弱。溫度是唯一一個系數估計值大于标準誤的協變量(表2)。較溫暖的地區更有可能有顯著較高的PD。一個地區較低的RPD表明分支相對較短,可能表明最近受到的輻射較多。氣候和地形驅動因素分析結果顯示,在溫度穩定性和降水量較高的地區,RPD較高。此外,低海拔地區的RPD較高(表2)。

蝴蝶和植物系統多樣性的異同

在以蝴蝶PD作為植物PD的響應變量的簡單線性模型中,蝴蝶和北美植物的PD呈現出相似的模式(r2=0.34),不一緻區域顯示出中等的殘差空間結構。蝴蝶的PD在熱帶地區高于被子植物的預測,在北美西海岸則低于被子植物的預測(圖6)。令人驚訝的是,蝴蝶和植物的RPD模式并不相似(r2RPD表現出較強的線性模型殘差空間結構,蝴蝶的RPD遠高于被子植物的RPD預測(圖6)。蝴蝶和植物都表現出墨西哥南部PE值最高的模式,但總體上,北美之間的相似性相對較弱(r2=0.10)。PE線性模型的空間殘差反映了該大陸南部的PD,但在該大陸的溫帶地區沒有空間結構誤差(圖6)。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖3 PD差異有統計學意義

(A)被子植物和(B)北美洲蝴蝶的系統發育多樣性(PD)的統計顯著性。具有顯著高值的地區,其類群的親緣關系比偶然性預期的要低(藍色),而具有顯著低值的地區,其類群的親緣關系比偶然性預期的要近(紅色)。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖4 RPD差異有統計學意義

(A)被子植物和(B)蝴蝶的相對系統發育多樣性(RPD)的統計顯著性。藍色區域的分支明顯長于預期;紅色區域的分支明顯短于預期。

與被子植物相比,蝴蝶的PD顯著不同,南部高于預期值,北部低于預期值(圖3)。被子植物表現出強烈的模式,在北美西部RPD顯著低于預期值,而在墨西哥南部和北美東部顯著高RPD值(圖4)。蝴蝶在墨西哥南部的熱帶潮濕和幹燥森林中也有顯著高的RPD區域,但與開花植物不同,它們在下加利福尼亞和美國西南部也表現出高RPD。此外,與被子植物不同,蝴蝶在東部溫帶森林中沒有顯示出顯著較高的RPD。在北美西部大部分地區,兩組的RPD均顯著較低(圖4)。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖5 CANAPE結果

CANAPE結果顯示,(A)被子植物和(B)蝴蝶的系統發育特有中心具有統計學意義。所有着色細胞的PE均顯著較高。紅色細胞集中罕見短枝;藍色細胞有濃度的罕見長枝(古特有),紫色細胞有新和古特有的混合物。

開花植物和蝴蝶表現出普遍不一緻的地方性模式。雖然CANAPE對蝴蝶的研究結果也顯示了佛羅裡達州混合的系統發育特有性,但對不同群體的研究結果在其他方面截然不同。蝴蝶在墨西哥北部、溫暖的沙漠和西南較冷的沙漠的部分地區表現出強烈的混合地方性模式,在西部沿海地區主要是新地方性,在墨西哥南部則表現出有限的古地方性(圖5)。

讨論

我們提出了第一個大陸尺度的蝴蝶系統多樣性分析。該分析相對完整,對所有物種進行了粗尺度分布資料,并對北美物種進行了~75%的采樣。這種完整程度首次為整個昆蟲亞目的系統發育多樣性提供了一個解析良好的、大陸尺度的視角。然而,即使擴充了終末類群的範圍估計,也不能完全解決“邊緣效應”問題,因為研究區域以外的相關類群範圍大小仍然被忽略,這意味着較深分支的範圍估計可能會很差,影響PE。

盡管我們預測溫度和降水穩定性将是PD和RPD顯著性的關鍵預測因子,但它們在任何模型中都不是頂級預測因子。相反,目前的年溫度是PD顯著性的主要驅動因素,在包括空間相關随機效應後,我們的預測變量在确定RPD顯著性的驅動因素方面沒有特别有用。下面,我們根據北美的主要地區更徹底地總結了這些結果,重點是跨地理距離和環境梯度的合成。

北美北部:我們将北美北部定義為在21000年前的最後一次冰河時期大部分被冰覆寫的地區。大陸北部的PD較低,而RPD不低。前者表明了寒冷和季節性條件導緻的環境過濾的重要性,後者在冰川旋回中軌道強迫範圍擴張和收縮,但有限的支裂作用。

美國西部:過去冰蓋以南和溫暖沙漠以北的西部地區顯示出非常強的顯著低PD和RPD模式。前者表明潛在的環境過濾,考慮到陡坡的海拔和氣候梯度本身在更新世冰期-間冰期循環期間處于變化之中,而後者可能表明蝴蝶在這些地區經曆了最近的輻射。

北美南部:北美南部地區表現出特别驚人的結果,特别是在溫暖的沙漠地區。PD和RPD在北美的熱帶地區都顯著較高,這與熱帶為蝴蝶多樣性博物館的觀點一緻。在溫暖的沙漠中,我們發現了顯著的高RPD,但沒有迹象表明聚集或過度分散的PD。這個新結果表明,在上新世中期形成的氣候中,沙漠中存在着古老的蝴蝶群落。人們早就知道,在這一地區發現的開花植物來自于荊棘叢和幹旱高地的相關譜系,這些譜系在系統發育上要古老得多。

落基山脈東部:包括大平原和東部溫帶森林在内的落基山脈東部地區的PD和RPD并不顯著,這與開花植物的空間系統發育發現形成了對比,我們将在下面詳細讨論。我們特别驚訝的是,在中新世和上新世降溫期間以草地為主的大平原地區,并沒有出現比預期更年輕的譜系的積累(即RPD顯著較低),正如在其他類群中所記錄的那樣。此外,佛羅裡達熱帶地區的PD或RPD發生率并不顯著較高。然而,熱帶佛羅裡達和附近的沿海平原确實顯示出顯著高水準的混合PE,這與已知的植物生物多樣性熱點一緻。

考慮到強烈的生态關聯和共同的非生物驅動因素在漫長的進化時間架構中發揮作用,我們預測蝴蝶和植物具有相似的系統多樣性模式,同時也承認替代假設。這一預測在非洲大陸的西部和北部得到了普遍的證明,這兩個地區都受到了包括冰川作用和幹旱化在内的近期擾動的影響。然而,我們的分析也揭示了顯著的差異。例如,蝴蝶和開花植物沒有表現出相似的RPD模式,這表明蝴蝶和被子植物之間的多樣化時間和速率可能在這一分析的規模和程度上沒有關聯。造成這些差異的原因可能部分與方法學有關。然而,這些結果也表明,共同的曆史力量和強烈的生态關聯仍然可能導緻不同的曆史和目前生物地理結果。我們将在下面讨論更多關于相似點和不同點的方法論和生物學原理。

雖然我們在兩項研究中使用了一緻的PD名額,進而可以直接比較輸出結果,但開花植物和蝴蝶分析的采樣完整性差異很大。開花植物的采樣包括比蝴蝶多一個數量級的命名物種,但在系統發育(包括約44%的分類群)和空間分布資訊方面都不完整。

這些采樣完整性和空間偏差的差異使得模式的強評估更具挑戰性。顯著的低PD(系統發生聚類)通常被認為是生境過濾,這是由于系統發生保守的生境偏好導緻近親屬傾向于在群落中一起出現。很可能是栖息地偏好在種子植物中比在蝴蝶中具有更高的保護水準,這一可能性需要未來的研究。

雖然人們早就知道,北美西部已被區域構造運動、造山運動和氣候變化極大地重塑,但這些影響對脊椎動物以外的動植物的全部程度剛剛開始被了解。植物空間系統發育研究以驚人的方式證明了這一點,東部溫帶森林顯示出的植物譜系比大平原和北美西部地區的植物譜系要古老得多,兩者都受到冷卻和幹旱化的強烈影響,顯示出更多的近期多樣性。我們希望在蝴蝶的RPD檢測中找到一緻的結果。但兩組間RPD相關性不強。根據空間殘差圖(圖6),西部的蝴蝶群落相對較年輕。此外,盡管西部的一些部分顯示植物和蝴蝶的RPD低于預期,這表明與其他地區相比,那裡的輻射更近,但我們在東部的蝴蝶RPD并沒有像在植物中那樣高于預期。在墨西哥,蝴蝶的RPD顯著高于植物。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖6 對觀察到的PD(A)、RPD(B)和PE(C)進行單變量線性回歸的空間殘差,其中被子植物名額用于預測蝴蝶名額。高殘內插補點(藍色)表示蝴蝶值高于預測值的區域。

這些結果表明,在不同營養水準的群體之間進行比較時,較不穩定的地區,如北美的北部和西部,可能會表現出适度的不一緻性,但方式是一緻的。在西方,由連續森林的喪失和持續的冷卻和幹燥引起的更廣泛的擾動可能導緻了更強的不平衡,蝴蝶緊随該地區新植物譜系的爆發而形成。相對系統發育多樣性的空間殘差圖支援這種情況(圖6),但有必要在其他食草動物中進行進一步檢查,以确定這種排序效應是否更普遍。我們假設,具有更活躍地質曆史的地區将顯示宿主和消費者/傳粉者之間的群落年齡滞後的證據。

在CANAPE發現的植物和蝴蝶的系統發育特有模式驚人地不一緻,在墨西哥南部和中部發現的植物特有模式比蝴蝶強得多。Mishler等人截斷了感興趣區域南部邊緣的範圍,這可能會導緻更多人為的範圍限制和更高的地方性。盡管如此,植物和蝴蝶地方性的不一緻是值得注意的,并可能指出蝴蝶和植物之間在生态、進化和生物地理過程中的根本差異,值得進一步研究。

保護蝴蝶的重要性

蝴蝶正受到威脅,最具代表性的是帝王蝶及其數量的下降。這裡的結果為更好地優先考慮保護需求的地區提供了參考。我們記錄了PE、PD和RPD高的地區,這些區域很可能是優先保護的區域。雖然一些熱點地區早就被認識到,但了解哪裡的多樣性最高、最稀有、最受威脅仍是有待完成的重點工作;例如,北美沿海平原地區最近才被認為是一個熱點,仍然需要進一步的工作。我們的研究結果為溫暖沙漠的栖息地保護提供了強有力的證據,尤其是還沒有被記錄在案的生物多樣性熱點。

佛羅裡達維管植物的空間系統發育:校準和不确定性對多樣性估計的影響

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

最近生物多樣性資料資源的可用性使我們能夠在廣泛的範圍内估計基于系統發育的生物多樣性名額。在本文中,我們探讨了系統發生源樹之間的差異和系統發生不确定性的水準如何影響這些名額,并檢驗了關于美國佛羅裡達不同維管植物區系地理生物多樣性模式的現有假設。我們将1,490個佛羅裡達物種的生态位模型與“專門建構的”系統發育樹(系統發育圖和時間圖)以及來自社群資源的樹(系統發育樹和開放生命樹)相結合。

最近生物多樣性資料(空間和遺傳)以及環境資料(關于氣候、地形和植被)的爆炸式增長,以及新的分析方法和工具推動了物種分布模組化和将這些結果組合成廣泛的多樣性評估,比通過較淺節點連接配接相同數量物種的其他地區更加多樣化。系統發育方法将多樣性測量從簡單的物種計數擴充到也可以告知進化模式和過程的測量。

PD的計算方法是系統發生樹中從特定位置連接配接終端類群的分支長度的總和,通常是到樹的根部。PD可以解釋為系統進化圖中感興趣區域所包含的“特征多樣性”的數量,在一個區域中出現的無形态的數量,或者在使用時間校準的年表時,作為“進化史”的數量(Davies 和 Buckley, 2012;羅索風,2010)。對于PD較高的區域,可以優先考慮保護,因為包含更高的遺傳多樣性或更大量的進化史),盡管在保護評估中顯然還有其他潛在的标準,如威脅狀态(Jetz 和 Freckleton, 2015)。

盡管獲得這種樹相對容易,但它們的品質和固有的不确定性很少被研究,這些因素對PD評估的影響也沒有得到很好的研究(Molina-Venegas and Roquet, 2013;Rangel et al.,2015;Thornhill et al.,2017)。樹的拓撲結構和分支長度都是由類群的采樣和所采用的基因序列決定的,在計算和解釋PD測量時必須考慮這些因素。例如,從一棵樹上進行有限的分類學采樣會産生比真實存在的更長的單個分支,而對遺傳資料進行有限的采樣可能會導緻不具有代表性的分支長度。同樣,使用種系圖和時間圖會産生分支長度差異,是以PD測量值也會不同。

本文以佛羅裡達維管植物為例,全面分析了輸入系統發生樹的選擇和系統發生不确定性的納入如何影響PD名額的評估。為了測試輸入樹的重要性,我們開發了系統發生樹,具體目的是通過與分布模型的內建來估算生物多樣性。

我們選擇佛羅裡達作為研究的重點,因為它是約4300種本地或馴化維管植物的家園,并且擁有廣泛的陸地和水生栖息地(Wunderlin 等,2017)。此外,佛羅裡達是北美沿海平原生物多樣性熱點的一部分(Noss et al.,2015),也是美國聯邦敏感、受威脅和瀕危物種密度第三高的地區(Ihlo 等人,2014 年),僅次于加州和夏威夷(多布森等人,1997 )。此外,佛羅裡達三分之一的植物群現在是由外來物種(自然或入侵)組成的,由于人類發展而導緻的栖息地喪失越來越多(Gordon, 1998)。然而,盡管該地區的生态和保護問題非常嚴重,但人們對佛羅裡達植物多樣性的總體地理格局知之甚少。

我們的實證目标是檢驗關于佛羅裡達生物多樣性模式的假設,這些假設來自于之前對森林類型、脊椎動物和蝴蝶的研究。特别是,通過記錄佛羅裡達從北到南的多樣性整體下降的工作,盡管這種模式隻是根據各種脊椎動物和蝴蝶的豐富度地圖進行了定性評估。

本研究的方法目标是探讨系統發生樹的選擇對空間系統發生量度(PD和RPD)的影響,并提供一種更有效地解釋系統發生樹中不确定性來源的方法。我們使用多種輸入系統發生樹生成PD和RPD,并使用多種方法比較結果,以了解如何解釋這些評估的差異和不确定性。我們還研究了從現有超級樹修剪的樹木和從策展分析中推斷出的樹木之間的空間系統發育名額如何變化,在策展分析中,使用一種戰略方法進行基因采樣和分支長度評估,做出了嚴格的努力來縮小分類單元采樣中的差距。最後,我們使用貝葉斯架構生成了代表系統發育估計不确定性的樹分布,以評估對PD的影響。

結果

所有模型的驗證名額均較高,訓練曲線下面積(AUC)評分均>0.8分,幾乎所有情況下的測試AUC評分均在訓練評分的0.15分以内。一小部分模型的表現明顯較差,其中訓練和測試的內插補點為>0.5。我們删除了離群點AUC評分與最終分析的均值相差>3個标準差的物種。最終,接受了1490個模型(即。每個物種一個)。圖1顯示了佛羅裡達4公裡分辨率下基于堆疊模型的物種豐富度,從最低的57個物種到最高的856個物種。圖2總結了全州觀察到的PD名額,包括譜系圖和時間圖。

基于這兩個質粒基因的維管植物之間的親緣關系與基于更多基因和類群的系統發育分析結果基本一緻。已知的迅速輻射的譜系(如菊科)也如預期一般表現出較短的分支。同樣,由于分支長度短,也有進化支的系統發育分辨率非常低。佛羅裡達維管植物的整體系統發育架構與基于更廣泛地理分析的公認架構高度相似,維管植物亞分支之間的關系也反映了其他研究的結果。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖1所示。佛羅裡達維管植物的種系圖、時空圖和物種豐富度(A)佛羅裡達1490種維管植物的種系發生,如圖(左)和(右)所示。年表上的黑點表示17個校準點的位置。(B)顯示物種豐富度的地圖,其中一個網格細胞的PD在系統圖和時間圖上用紅色突出顯示。

拓撲與已發表的分析不同的少數執行個體都是與預期的微小偏差,并且是有限資料集(即資料集)的結果。考慮到佛羅裡達的維管植物隻是全球多樣性的一個小子集,這些偏差也可能反映了采樣問題。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖2 佛羅裡達維管植物的系統發育多樣性從維管植物的系統發育圖(左)和時序圖(右)測量的觀察到的(上面闆)和顯著的(下面闆)系統發育多樣性。在最上面的面闆上,環境保護署(EnvironmentalProtectionAgency)的III級生态區用深色線标出,IV級生态區用淺色線标出,并标出了感興趣的區域,如威爾士湖嶺和邁阿密嶺。

PD分析,因為支援更好的長分支貢獻了絕大多數PD(Gonza´lez- Orozco 等, 2016)。用化石限制對這棵樹進行校準(表S4),得到了與下遊分析中的系統圖進行比較的時間圖(圖1);該年表相對于譜系圖平滑了分支長度(參見圖1進行比較)。

相對于美國環境保護署(EnvironmentalProtectionAgency)的III級和IV級生态區(圖2)和緯度(圖3)繪制佛羅裡達州的PD圖,揭示了生态和地理模式。PD最高的地區為佛羅裡達州半島北部,南部至奧蘭多和聖彼得堡附近。在譜系圖和時間圖中,佛羅裡達州中部的PD高于該州北部和南部(圖2)。在縱向上,佛羅裡達州南部呈現出混合模式;大沼澤和大柏樹的PD相對較低,而同一緯度的邁阿密嶺的PD相對較高(可見圖3在26.5N朝向正PD值的長尾)。各生态區的平均PD值也顯示,貫穿佛羅裡達半島的南部沿海平原的PD高于其他地區(表1)。

在譜系圖和時間圖上測量的PD顯著高或顯著低的地區存在差異(圖2)。時間圖得出的值顯示,佛羅裡達州北部和中部地區有很強的均勻模式,特别是在東南部沿海平原生态區。相比之下,基于種系圖的PD顯著性更直接地代表了特征多樣性,顯示了該州幾個地區的種系發生聚類,特别是佛羅裡達西北海岸沿線,任何地方都很少均勻。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖3 緯度系統發育多樣性研究區域以0.5?分成13個緯度剖面,用右邊地圖上的線表示。左邊的豆狀圖分别代表了系統發育圖(上)和時間圖(下)中每個剖面内像素的系統發育多樣性值

RPD模式在譜系圖和時間圖之間也有顯著差異。在時間圖和種系圖得出的值之間存在主要差異的地理區域包括(圖4):(1)佛羅裡達北部,時間圖産生了高觀察值的RPD,以及更廣泛的顯著高RPD濃度(即RPD)。分支比預期的要長),比系統圖得出的結果要長;(2)佛羅裡達州中部,那裡的系統進化圖通常沒有顯示出顯著的低RPD(即RPD)。比預期的分支更短),而時序圖則如此;(3)佛羅裡達非常南部,包括邁阿密山脊地區

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

表1 對三個生态區所包含的細胞進行PD和SD計算,用于系統進化圖和時間圖

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖4 相對系統發育多樣性從維管植物的(A和C)系統發育圖和(B和D)時序圖中測量的觀察到的(上面闆)和顯著的(下面闆)相對系統發育多樣性。

由于分支長度是通過相同的排列确定的,是以預計專門建構的樹和OTL的樹之間存在相似。每個源系統圖産生的PD值在佛羅裡達狹長地帶和半島佛羅裡達沿線顯著聚集,而每個源時間圖産生的PD值在狹長地帶北部邊緣呈現均勻性。我們發現,OTL樹和專門建構的樹最相似,隻有不到5%的細胞對親緣關系衍生值顯示顯著性差異,不到20%的細胞對基于時間軸的值顯示顯著性差異。利用Phylomatic樹進行的測量,盡管删除的類群較少,但與專門建造的樹有更多的差異超過25%的細胞表現出不同的顯著性結果(圖5;表2).不同方法之間的分類單元采樣差異适度影響了這一空間系統發育度量(例如,在分類單元較少的情況下,隻有LWR以東的區域作為系統發育圖中顯著的聚類區域是突出的;圖5b)。

總體而言,根據100種時間計圖計算的PD評分的标準差大于根據100種譜系圖計算的标準差,兩種地圖之間的相似性在狹長地帶和佛羅裡達最明顯(圖6A-6C)。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖5 多樣性假設檢驗比較了使用我們的特制樹、Phylomatic樹或開放樹建構的維管植物的時間圖和種系圖

頂部面闆是專門建構的樹的種系圖和時間圖,修剪為(A)種系和(B)開放樹分類集。中間的面闆是(A)種系樹和(B)開放樹樹。下方的面闆是兩幅地圖的差異。灰階像素是指種系目的建構樹與開放樹目的建構樹在顯著性水準上發生變化的像素。

讨論

我們在佛羅裡達半島北部(而不是在狹長地帶)發現了植物多樣性的高峰。雖然佛羅裡達半島北部的PD可能是最高的,但許多狹長地帶的PD明顯多于預期,特别是在考慮時間圖而不是系統圖時。東南森林由包含深度進化分支的群落組成,特别是在時間校準的系統發育中。在最後一次間冰期完全被淹沒的南佛羅裡達(Germain-Aubrey 等人,2014),我們發現了一種不同尋常的種系多樣性模式,其中隻有種系圖顯示了RPD的強烈信号,即RPD。在零假設的前提下,分支明顯比預期的長。我們認為,通常朝向尖端的分支相對較長的種系圖在某些情況下可能比時間圖顯示出更強的模式,時間圖傾向于将分支長度從末端重新配置設定到較深的分支(如圖1所示)。在佛羅裡達南部,加勒比或中/南美洲起源的類群群落可能以較長的末端分支為主。進一步檢查群落組成和方法選擇可能産生的僞影是有必要的。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

表2.顯示樹資源之間不同結果的單元格數

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

上圖:在我們的貝葉斯分析中,所有(A)100個種系圖和(B)100個時間圖中觀察到的系統發育多樣性的标準差。(C)右邊用藍色表示的兩者之間的差異。底部:淺藍色的區域是指有91(100)棵或更多的樹具有相同顯著性水準的區域。黃色的區域大多是一緻的,100棵樹中有71-90棵發現了相同的顯著性水準。紅色的區域是相對不一緻的像素,隻有50-70棵樹對(D)100種系統圖和(E)100種時間圖具有相同的顯著性水準。

在佛羅裡達州中部半島,我們發現了比使用系統發育圖或時間軸圖預期的更強的系統發育聚類模式和更短的分支。雖然佛羅裡達中部是一個植物多樣性豐富的地區,但它包括在更新世間冰期海平面上升期間被淹沒的地區,以及更持久的旱灌叢,但由于某些譜系對這些地區惡劣環境(例如過度排水的土壤和極端高溫)的進化保守偏好,共存的類群可能被過濾了。或者,這種模式的一部分可能是由于原位分化,而一些類群可能是較近期到達的。

我們的結果也與在其他遠親動物世系中發現的結果一緻。利用佛羅裡達差距分析,記錄了脊椎動物和蝴蝶的高物種豐富度,特别是在狹長地帶,并延伸到佛羅裡達中部的核心。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

表3 每一類不确定性中的單元數Class表示具有一緻顯著性水準的樹的數量。例如,50-70類表示對于那些像素中50-70的樹具有相似的顯著意義,而50-30的樹不具有相似的顯著意義。對于71-90類,更多的樹是一緻顯著的,而對于91-100類,大多數樹發現了相同的顯著性水準,這表明在考慮系統發育估計的不确定性時,這些像素是一緻的。

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖7 不同緯度的系統發育多樣性的不确定性研究區域以0.5?分成13個緯度剖面,用右邊地圖上的線表示。豆狀圖分别代表了系統譜系圖(左)和時間序列圖(右)中每個剖面内每個像素的所有100棵樹的系統發育多樣性值。

最後,考慮到已知的流行區和不同尋常的植物群,兩個特别值得關注的地區是邁阿密脊松岩地和LWR(位置見圖2、左上角和圖S3)。正如預期的那樣,在邁阿密脊地區,我們發現基于時間圖的一些像素的PD增加和顯著的PD聚類,而在系統圖的其他像素的RPD顯著高。特别是LWR,已知具有高度的地方性物種多樣性(Myers and Ewel,1990;Germain-Aubrey et al.,2014),我們假設在未來使用系統發育地方性名額進行檢查時,可能會顯示出高度的新地方性。緊鄰LWR東部的區域則表現出較強的聚集性,該地區是一個栖息地馬賽克,包括松平原、幹燥草原和沼澤(Myers and Ewel,1990),該地區的顯著聚集可能表明這些栖息地有很強的過濾作用。在邁阿密脊松岩地等地區也發現了保護優先區,這些地區受到快速、持續的人類發展的直接威脅,為保護行動提供了進一步的有力理由。

蕨類植物(單生植物)、裸子植物和被子植物的主要進化支之間的關系與專注于這些特定亞進化支的更廣泛的系統發育分析密切一緻(例如,被子植物系統發育組 IV, 2016;Schuettpelz and Pryer, 2007;Smith et al.,2011;Soltis et al.,2011;史蒂文斯,2001)。在專門建構的佛羅裡達樹上,一些比較困難的區域在OTL生成的拓撲中得到了适當的解決。這可能是由于OTL的不斷更新特性,其中樹拓撲将以前估計的樹內建到架構中,以産生一個”合成”樹。本研究結果提示,OTL可能是未來空間系統發育分析的重要資源。如果在OTL中所代表的區域有足夠的終端類群采樣,研究人員将能夠節省大量的時間來建構自己的區域特定的樹。

雖然進化樹和OTL可以給出相對準确的拓撲結構,但計算這些樹的分支長度仍然存在問題,特别是在使用種系圖時。為了解決這個問題,我們使用DNA序列比對來估計OTL拓撲上的分支長度,這可能解釋了為什麼我們發現,與進化樹樹相比,基于我們專門建構的樹和OTL樹的結果之間的差異較小(圖5)。然而,這種方法需要為OTL系統發育樹組裝比對,這可能無法達到使用這些資源的目的。目前正在進行的工作是将分支長度估計添加到OTL方法中,這将進一步提高OTL作為空間系統發育分析來源的強大效用。

分類單元采樣可能是使用存儲庫中的樹的另一個問題。進化樹幾乎包含了我們所有的終端類群(99%),比OTL樹的類群(80%)還要多。如果我們試圖對佛羅裡達的所有維管植物物種進行分析,目前還不清楚有多少分類群是可用的。我們發現,當去除250個類群時,佛羅裡達中部顯著成簇的細胞數量顯著減少(圖5)。這一結果表明,更有限的分類抽樣可能會降低一些功效。然而,我們目前的分析可能合理地捕捉了佛羅裡達州PD的總體趨勢,提供了急需的多樣性初步快照。

圖6顯示,大約20%的像素在100棵樹中表現出中度到高度的顯著性差異,在不顯著和顯著高或顯著低之間翻轉(但從不從顯著高到顯著低)。在系統圖和時間圖中都發現了這種模式,盡管時間圖的每像素标準差要高得多。

從我們的分析中可以得到兩個關鍵資訊。首先,雖然不确定性可能會影響對某些網格細胞的PD和RPD顯著性的判斷,但這些細胞似乎沒有地理結構,是以本文中觀察到的少量不确定性不會在景觀尺度上廣泛影響結論。

譜系圖和時間圖這兩個名額都以不同的方式提供資訊。根據定義,在系統圖上測量PD高的區域具有較高的遺傳多樣性,如果目标是儲存遺傳多樣性,這可能是更好的測量方法,而在時間圖上測量PD高的區域包含異常大量的進化時間,如果目标是儲存進化多樣性,這可能是更好的測量方法。

研究的局限性

雖然這項研究包括了佛羅裡達植物的1490個分類群,但已知該州有4000多個維管植物物種,完全納入所有物種可能會影響本文的結果。收集更完整的分布資料,特别是範圍受限物種的進一步努力正在進行中,這些記錄有望幫助進一步的物種分布模組化。我們注意到,盡管使用一小組标記恢複的系統發育與已知的關系一緻,但下一步将進一步開展工作,以開發更可靠的系統發育假設。最後,進一步的工作将這些模式與人口高速增長和海平面上升的地區聯系起來,将為保護工作和提供參考。

基于先進機器學習技術的全球植物多樣性模型和預測

盡管植物多樣性對生态系統功能、生物地球化學循環和人類福祉起着至關重要的作用,但關于其全球分布的知識仍然不完整,阻礙了基礎研究和生物多樣性保護。在這裡,我們使用機器學習(随機森林、極端梯度增強和神經網絡)以及傳統統計方法(廣義線性模型和廣義加性模型)來檢驗大尺度維管植物多樣性梯度的環境相關假設,并在全球範圍内模組化和預測物種豐富度和系統發育豐富度。為此,我們使用了830個區域植物目錄,包括約30萬個物種過去和現在環境條件的預測因子。機器學習表現出了優異的性能,可以解釋高達80.9%的物種豐富度和83.3%的系統發育豐富度,說明了這種技術在解釋環境與植物多樣性之間複雜關系的巨大潛力。目前的氣候和環境異質性是主要的驅動因素,而過去的環境條件對植物多樣性的影響很小,但可以檢測到。最後,我們結合多種模組化技術的預測(集合預測),在7774平方公裡的多個分辨率上揭示了全球植物多樣性模式和中心。我們的預測地圖提供了宏觀生态學相關的全球植物多樣性的準确估計。

維管植物包括超過34萬個物種(Govaerts等,2021年),是陸地生态系統維持生态系統功能(Tilman等,2014年)和提供生态系統服務的基礎(Isbell等,2011年;Cardinaleetal.,2012)。為了保護和管理這一全球生物多樣性的重要組成部分,了解其空間分布和生物多樣性中心的位置至關重要。從19世紀開始,通過整理區域植物物種數量和專家繪制的物種豐富度等值線(Wulff,1935;BarthlottEtal.,2005;參見Mutke&Barthlott,2005年)。,繪制植物分布和多樣性的地圖具有悠久而豐富的傳統。從那時起,通過對環境和空間變量響應的多樣性模式模組化(Keil&Chase,2019;Sabatini等人,2022年),這些地圖被細化和縮放到不同的分辨率(例如12100公裡2在Kreft&Jetz,2007),允許在全球範圍内進行連續預測。這種預測圖的準确性取決于現有植物多樣性資料、環境預測因子和應用模型的品質和代表性。最近在資料可用性和模組化技術方面的發展使植物多樣性模型具有迄今為止前所未有的分辨率和準确性。

近年來,基于國際上動員整理物種發生記錄的努力,對全球植物分布和植被樣地(Sabatini等人,2021年)以及區域清單、植物區系的了解有所增加(Enquistetal.,2016;GBIF,2020年)。然而,這些資料在精度、完整性和範圍上有所不同(K€onigetal.,2019)。具體來說,細粒度的資料,如發生記錄和植被圖,往往在地理上有偏差,僅覆寫部分區域植物區系(Meyeretal.,2016;Qianetal.,2022)。盡管是粗粒度的,并且經常被人為劃分,但行政邊界、清單和植物區系反映了迄今為止最完整和最權威的區域植物區系組成,并且幾乎完全覆寫全球(Weigelt等人,2020;Govaerts等人,2021年)。是以,清單和植物區系是植物多樣性-環境關系全球尺度模組化以及預測不同粒度的植物多樣性(Keil&Chase,2019)的有用資源(Kreft&Jetz,2007)。包括物種身份進一步推動整合物種級别的系統發育和性狀資訊,為研究所學生物多樣性的多個方面提供了機會。

盡管人們普遍認為植物多樣性反映了進化、地質和生态過程的複雜互相作用,但解開全球植物多樣性的驅動因素仍然是現代宏觀生态學的一個重要主題(Kreft&Jetz,2007;Tietjeetal.,2022)。一些與地理、過去和現在的氣候以及一個地區的環境異質性有關的假設(Currie等,2004;Mittelbachetal.,2007)被提出來解釋植物多樣性模式。例如,大而異質性的地區被假設通過提供更多樣化的資源和栖息地來支援更多的物種,進而促進物種共存(Connor&McCoy,1979),并在環境波動期間提供避難所(Steinetal.,2014)。此外,溫暖、潮濕和相對穩定氣候的地區,如潮濕的熱帶森林,由于高物種形成,應該支援更多的物種(Rohde,1992;Mittelbachetal.,2007;Brown,2014)和低滅絕率(Gillooly&Allen,2007;Eiserhardtetal.,2015)。地理隔離可能同時促進物種滅絕(Brown&Kodric-Brown,1977;Ouborg,1993)和物種形成(Kisel&Barraclough,2010)。最後,曆史過程,如過去的闆塊構造和氣候變化,通過改變生物隔離和交換或物種範圍轉移,影響了多樣性模式(Dynesius&Jansson,2000;Svenningetal.,2015;Couvreuretal.2021)。

多樣性-環境關系通常是複雜的、非線性的和尺度依賴的(Francis&Currie,2003;Keil&Chase,2019)。許多環境預測因子互相作用并表現出高度共線性,是以對正常統計模型(如廣義線性模型(GLMs)和廣義可加性模型(GAMs)提出了重大挑戰。機器學習方法代表了強大的模組化工具,可以有效地處理相關資料,并可以揭示非線性關系和預測器之間的互相作用(Oldenetal.,2008;Criscietal.,2012),而無需先驗規範。是以,機器學習已經成為生态學中傳統技術的一種有前途的替代方案(Hengletal.,2017;Parketal.,2020;Sabatini等人,2022)。

在此,提出改進模型和預測維管植物多樣性的兩個關鍵點,即物種豐富度和系統發育豐富度,在全球範圍内使用先進的統計模組化技術。除了非空間和空間glm和gam之外,我們還系統地評估了機器學習方法的預測性能,包括随機森林、極端梯度增強(XGBoost)和神經網絡。具體而言,我們的目标是:比較不同模組化技術在揭示複雜的多樣性-環境關系方面的表現,并改進全球地理統計植物多樣性模型;檢驗與地理、環境異質性、目前氣候和過去環境條件相關的植物多樣性梯度假設,并量化其對植物物種和系統發育豐富度的相對重要性;以及,在全球範圍内預測多種粒度下植物多樣性的兩個方面。我們的研究基于全球830個地區的清單和植物群中的約30萬個物種(圖S1),這些物種在《全球植物群和性狀清單》中進行了整理(Weigelt等人),。

結果和讨論

植物多樣性模型的性能

表1基于交叉驗證的維管植物多樣性全球模型性能

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

使用随機10倍和空間68倍交叉驗證來評估每個模型的預測性能。除最小充分廣義線性模型(GLM)和具有互相作用項的GLM外,非空間模型拟合了代表地理、目前氣候、環境異質性和過去環境條件的15個預測因子(表S1)。此外,空間模型還包含空間項(即同步自回歸(SAR)模型,包括地理坐标樣條的廣義可加性模型(GAMs),以及包括三次多項式趨勢面的機器學習方法)。基于赤池的資訊準則(AIC),對完整的GLM進行簡化,得到最小充分GLM。拟合了具有互相作用項的GLM,拟合了全部GLM的預測因子以及能量-水、能量異質性和區域環境相關變量的互相作用,并基于AIC進行了簡化。由于響應變量(即物種和系統發育豐富度)在模型中是對數轉換的,是以精度統計資料是在對數尺度上提供的。基于所有袋外樣本,所示值為均方根誤差(RMSE);由模型解釋的變異量,計算為1減去觀測與預測之間的誤差平方和與總平方和(R2)之比。

我們的研究結果揭示了機器學習,特别是決策樹方法在模拟植物多樣性與環境關系以及在不同尺度上準确預測植物多樣性方面的巨大潛力。總體而言,模型的預測能力很高(表1)。機器學習模型和GAMs優于GLMs和空間模型(即包含空間項的模型,以考慮區域的空間非獨立性;Dormann等,2007)的總體表現優于非空間模型(物種豐富度的GLMs除外)。極端梯度增強是一個序列訓練決策樹的集合,它對物種豐富度(基于空間交叉驗證的變異解釋為70.3%,基于随機交叉驗證的變異解釋為80.9%)和系統發育豐富度(分别為73.7%和83.3%)産生了最準确的預測,這在空間和非空間模型中是一緻的。

我們發現空間項和環境變量之間存在很強的互相作用。這表明了植物多樣性和多樣性-環境關系的區域差異,并表明在預測跨地理區域的多樣性時,不同的環境變量組合是重要的(Keil&Chase,2019)。此外,機器學習模型揭示了能源和水可用性、能源和環境異質性以及面積和環境變量之間的強互相作用。通過隐含地考慮谷物依賴和空間和環境變量之間的複雜互相作用,我們的機器學習模型優于以前的植物多樣性模型(Kreft&Jetz,2007;Keil&Chase,2019),提高了我們對多樣性-環境關系的了解,并可改進跨尺度植物多樣性的預測。

維管植物多樣性全球模式的驅動因素

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖1:在五種非空間模型中解釋維管植物多樣性全球格局的環境變量類别的相對重要性(a)物種豐富度;(b)系統發育豐富度。不同變量類别的相對重要性(縮放到總和為1)計算為1減去使用随機重新洗牌的資料集的模型預測和使用原始資料集的預測之間的斯皮爾曼秩相關系數。每一類環境變量如表S1所示。單個環境變量的重要性見圖S19。GAM,廣義加法模型;GLM,廣義線性模型;XGBoost,極端梯度增強。

目前氣候變量是植物多樣性最重要的驅動因素,占物種豐富度變化的34.4%~48.1%,占系統發育豐富度變化的39.7%~58.2%。(圖1;表S1)高能量和水的可用性以及低季節性促進了物種和系統發育的豐富度(圖S5,S6),支援了其他大規模研究,這些研究報告了目前氣候對植物多樣性的強烈影響。環境異質性解釋了物種豐富度變化的21.0-40.9%,解釋了系統發育豐富度變化的16.3-27.2%,異質性的增加導緻了更高的植物多樣性,正如預期的那樣。盡管物種和系統發育豐富度高度相關(Pearson的r=0.98),但在多樣性與環境的關系中仍存在一些差異。例如,環境異質性對系統發育豐富度的解釋低于物種豐富度的解釋。這可能反映了由高環境異質性促進的原位物種形成信号,産生了密切相關的物種叢集,與物種豐富度相比,系統發育豐富度相對較低。考慮物種豐富度後,土壤類型數量對系統發育豐富度剩餘變異的負影響也支援了這一觀點(表S2)。

地理變量(面積和地理隔離)解釋了物種豐富度的9.8~23.1%,系統發育豐富度的18.0~24.6%。較大的區域往往具有較高的原位物種形成率,因為區域内地理隔離的機會更多,而由于人口較多,滅絕率較低。這些影響應該在獨立的、孤立的地區最為明顯,而在與其周圍環境相似的地區則不那麼明顯。此外,更大的區域通常提供更多種類的栖息地,為物種提供更多的環境生态位。地理隔離,這裡測量的是周圍陸地的比例,并不能解釋太多的變化,這可能是因為我們的資料集主要由大陸地區組成。雖然地理隔離是島嶼植物多樣性的主要驅動因素,但隔離和半島效應似乎在大陸上隻發揮了很小的作用,在大陸上,地理隔離可能對區域的組成獨特性和地方性更重要,而不是豐富度。

因為低滅絕和高物種形成率,我們假設較高的植物多樣性将積聚在氣候長期穩定的地區,是以,我們評估溫度穩定性和生物群落變化作為兩個古時期(LGM和上新世中期暖期)過去的氣候變化。與曆史變量對現代植物多樣性的預期遺産效應相反,過去在我們大多數的模型中,環境條件對物種豐富度的解釋僅為0.8-5.5%,但在神經網絡中高達23.8%。同樣,過去的環境條件對神經網絡系統發育豐富度的解釋能力(15.0%)高于其他模型(4.0-8.5%)。包括空間趨勢面或離散的生物地理區域(即植物區系王國)的模型(在統計上控制了目前和過去的環境後)進一步改善了模型的拟合(表1,S4)。這表明,除了LGM或上新世中期暖期以來的氣候穩定性外,上新世之前的生物地理曆史或氣候變化以外的區域特征影響了現代植物多樣性。這些曆史區域效應可能是由于分散障礙、特殊的殖民和多樣化的曆史(Qian&Ricklefs,2004;Ricklefs&He,2016)。

改進的全球植物多樣性地圖

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究

圖2:在分辨率為7774平方公裡的等面積六邊形網格上預測維管植物多樣性的全球格局。物種豐富度(a)和系統發育豐富度(Faith的PD,d)基于五種不同模型(即使用機器學習方法的三個空間模型、一個空間廣義加性模型和一個具有互相作用的非空間廣義線性模型)的內建預測,模型精度權重;物種豐富度(b)和系統發育豐富度(e)中心被定義為預測豐富度高于預測值的第90分位數的區域(即包含至少1765種植物和每7774km2的41866Ma的系統發育豐富度)。用于集合預測的模型之間的預測變化是通過物種豐富度(c)和系統發育豐富度(f)預測值的變化系數來計算的。水準線描繪了赤道和熱帶邊界。在(a)和(d)中,所有地圖都使用EckertIV投影。

我們制作了維管植物物種和系統發育豐富度的全球多樣性地圖,基于個體良好的模型和模型集合。由于其出色的預測能力和處理缺失資料的能力,我們認為XGBoost(包括地理坐标)是預測植物多樣性最強大的單一模型(圖S20d,S21d)。此外,我們還提出了集合預測,減少了選擇特定模組化技術所帶來的不确定性,進而提高了預測精度(Marmionetal.,2009)。包括區域面積及其與其他預測變量的互相作用,我們可以預測不同粒度的等面積和等距六邊形全球網格。

我們的整體預測(圖2a,d)以前所未有的細節和準确性描述了物種和系統發育豐富度的全球模式。這些地圖捕捉了多樣性如何随環境梯度變化,并确定了植物多樣性的全球中心(圖2b,e)。Barthlott等人,2005;Kreft&Jetz,2007)。雖然系統發育豐富度的模式與物種豐富度非常相似(Pearson的r=0.97),但在地中海周圍、中美洲、高加索和喜馬拉雅地區也存在差異(圖S24)。高分辨率的環境資料和模組化技術使得陡峭海拔梯度的地區在預測效應方面表現出更細微的變化(Barthlott等人,2005;Kreft&Jetz,2007)。

與此同時,我們的整體預測顯示,在物種貧乏的地區,如格陵蘭島和撒哈拉沙漠的非冰川地區,數值相對較高。在這裡,以及在具有植物多樣性極值的其他區域,單個模型的表現優于內建模型(圖S20,S21),後者傾向于衰減極值。物種和系統發育豐富度較高的區域主要分布在山區(圖S26)。具體來說,熱帶山脈,包括熱帶安第斯山脈、東非高地和各種亞洲山脈(如中國南部和馬來群島),是全球植物多樣性的中心。正如之前的研究發現的那樣(Testolin等,2021年),熱帶山脈的高度多樣性與溫暖潮濕的氣候和異質性環境有關(安東内利等,2018年)。多種生物地理和進化過程,包括由山區長期造山和氣候動态驅動的物種形成、擴散和持久性,導緻了突出的區域植物多樣性。造山過程不斷改變山區的土壤成分、營養水準和當地氣候,進而創造出新穎而異質的栖息地,植物譜系在這裡多樣化并從鄰近地區遷移。此外,氣候波動通過驅動山地内栖息地連通性的動态變化來刺激多樣性(Rahbek等,2019)。由于其陡峭的環境梯度和異質性,山區在氣候不利時提供了避難所(Bennettetal.,1991;Rahbek等人,2019年)。

在極端環境的地區,如沙漠和北極地區,模型之間的差異(以變異系數衡量)最大(圖2c,f)。北極地區在各模型中也始終表現出最高的預測不确定性(圖S27,S28)。極端環境地區的不确定性可能源于兩個原因。首先,物種極度匮乏的地區可能在已發表的多樣性資料中不太有代表性。具有極端環境的區域通常是人為劃分的區域的一部分,而不是單獨采樣(例如,查德和利比亞的采樣而不是撒哈拉沙漠)。這些人為劃定的區域環境異質性更強,削弱了環境因子和植物多樣性的極端值。衆所周知,即使對于環境相對同質的區域,清單和植物區系不僅包括優勢植被資訊,也包括無區域植被資訊,使其比主流條件下的預期更豐富,并可在更局部的尺度上觀察到(與Sabatinietal.,2022年的alpha多樣性預測相比)。

結論

我們提供了迄今為止最準确和全面的區域維管植物物種和系統發育豐富度的預測全球地圖。它們基于顯著改進的全球模型,使用了全面的植物分布資料、高分辨率的過去和目前環境資訊,以及先進的機器學習模型。我們的研究結果說明,機器學習方法适用于大分布和環境資料集,有助于明晰環境和植物多樣性之間潛在的複雜和互相作用的聯系。是以,機器學習方法有助于提高生物地理學和宏觀生态學的基礎了解和定量知識。更新的多種粒度維管植物多樣性地圖為大規模生物多樣性監測和植物多樣性起源研究提供了堅實的基礎,并為未來的全球生物多樣性評估和環境政策提供支援。

Earl, C., Belitz, M. W., Laffan, S. W., Barve, V., Barve, N., Soltis, D. E., ... & Guralnick, R. (2021). Spatial phylogenetics of butterflies in relation to environmental drivers and angiosperm diversity across North America. Iscience, 24(4), 102239.

Allen, J. M., Germain-Aubrey, C. C., Barve, N., Neubig, K. M., Majure, L. C., Laffan, S. W., ... & Soltis, P. S. (2019). Spatial phylogenetics of Florida vascular plants: The effects of calibration and uncertainty on diversity estimates. IScience, 11, 57-70.

Cai, L., Kreft, H., Taylor, A., Denelle, P., Schrader, J., Essl, F., ... & Weigelt, P. (2022). Global models and predictions of plant diversity based on advanced machine learning techniques. New Phytologist.

北美蝴蝶空間系統發育與環境因素及植物多樣性的相關性研究