天天看點

基于随機森林的洞庭湖苔草葉綠素含量估測研究該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R

作者:大娛楽嘉

基于随機森林的洞庭湖苔草葉綠素含量估測研究

該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R軟體建構了苔草葉綠素含量估測随機森林模型(RF),通過模型優化進而對苔草葉綠素含量進行定量估測,并将其估測效果與傳統的線性回歸模型相比。

研究表明:利用RF模型可高效地對植被葉綠素含量進行估測,其中預測值和實測值的相關系數達0.94,且其估測效果要優于多元和一進制線性模型,研究結果為濕地植被遙感監測植物及生态環境保護提供了科學依據。

葉綠素是植被進行光合代謝的重要載體,其含量與植被光能轉化、生理固碳等功能有着密切的聯系,是監測植被生長狀況重要的生化參數之一,準确快速地對葉綠素含量進行定量估測對植被生境具有重要意義。

高光譜遙感技術為估測植被葉綠素含量提供了極大的便利,目前常用的方法主要可歸納為2種經驗模型和實體模型。

前者主要是基于植被光譜指數與葉綠素含量的經驗或半經驗關系,進而建立起有效的估算模型,該方法的主要優點是模組化友善,但模型的普适性較差。

相比而言,實體模型具有較為清晰的機理,且模型通常具有一定的普适性,但該模型對調參的依賴高,尤其在缺參的條件下極大影響精度。總而言之,在植被葉綠素含量遙感估測

研究方面,在方法上仍有進一步改進的空間。

随機森林(randomforest,RF)可以很好地預測上千個解釋變量的貢獻,不需過多調參,具有抗噪能力強、多元共線性不敏感等優點。

随機森林算法已經被廣泛應用到各方面的研究。目前RF模型應用于濕地植被葉綠素含量估測的相關研究還鮮有報道。

該文以洞庭湖濕地最大的建群種植物—苔草為研究對象,以6種植被光譜指數為輸入變量,在R軟體平台上建立葉綠素含量随機森林估測模型,以期為植被葉綠素定量估測提供新的方法和思路。

利用FieldSpec4便攜式地物光譜儀,于2018年11月1到3号對洞庭湖濕地最大的建群種—苔草(Carexcinerascens)的光譜資料進行采集。同時利用SPAD-502葉綠素儀測定苔草葉綠素SPAD值。

後續的實驗中,劃分31組葉綠素SPAD值資料為訓練樣本用以模組化,另取30組資料用于檢驗模型的估測效果。

植被光譜指數

該文采用多種植被光譜指數作為RF模型的輸入變量,通過優化模型的參數,進而提高模型的預測精度。在表中展示6種光譜指數具體表達及與SPAD值的相關系數。

随機森林的實作

該研究基于R軟體平台,運作(1)中的指令以建立随機森林模型,運作(2)中的指令利用檢驗樣本對模型估測效果進行檢驗。

rf=randomForest(S1~.,data,ntree=1000,mtry=3) (1)

predict(rf,new.data,type=”response”) (2)

其中S1表示輸出變量,在該文中為葉綠素SPAD值;data表示輸入路徑;ntree表示随機森林模型中單棵樹性能的樹節點預選變量個數,一般ntree值應不小于100。mtry表示分類樹每個節點用以二分資料的自變量個數,mtry值等于解釋變量數目的平方根。

在該文中先采用mtry=3、ntree=1000進行建立模型。predict為預測分類函數,其中rf為基于預測樣本的随機森林模組化結果,new.data在本文中表示輸入的檢驗樣本,type表示對輸入樣本進行預測。

模型性能評價方法

該文根據三項名額對模型結果做出評價,分别為平均絕對誤差(MAE)、平均誤差平方和(MSE)和相對誤差平方和(NMSE),名額數值越小表示模型的預測值與真實值間的差異越小,随機森林對葉綠素預測能力越強。

三項名額公式表示如(3)~(5)所示。

MAE=1/n∑|^yi-yi| (3)

MSE=1/n∑(^yi-yi)2 (4)

NMSE=[1/n∑(^yi-yi)2]/∑(yi-yi)2 (5)

實驗結果

基于随機森林模型的葉綠素SPAD預測值和真實值間的相關圖。将該模型效果與多元線性(Multiplelinearregression,MLR)和一進制線性回歸模型(Alinearregression,ALR)作為對比。

結合圖表結果可見,RF模型對植被葉綠素SPAD預測效果優于其它兩種模型。總而言之,RF模型表現出了優越的預測性能。

結論

該文利用随機森林模型對洞庭湖典型植被苔草的葉綠素進行了估測。在該方法中,首先選取了6種植被光譜指數作為随機森林模型的輸入變量,通過優化模型參數,進而對植被葉綠素含量進行估測,最後将該模型的估測效果與多元線性回歸模型進行了比較分析。

研究表明,利用随機森林模型可以很好地對植被葉綠素進行估測,随機森林模型建構簡捷、資料處理能力強大。從模型預測的精度結果可以看出,相比較一進制和多元線性回歸模型,随機森林模型具有更優的預測性能(R2=0.94)。

基于随機森林的洞庭湖苔草葉綠素含量估測研究該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R
基于随機森林的洞庭湖苔草葉綠素含量估測研究該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R
基于随機森林的洞庭湖苔草葉綠素含量估測研究該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R
基于随機森林的洞庭湖苔草葉綠素含量估測研究該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R
基于随機森林的洞庭湖苔草葉綠素含量估測研究該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R
基于随機森林的洞庭湖苔草葉綠素含量估測研究該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R
基于随機森林的洞庭湖苔草葉綠素含量估測研究該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R
基于随機森林的洞庭湖苔草葉綠素含量估測研究該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R
基于随機森林的洞庭湖苔草葉綠素含量估測研究該文以洞庭湖濕地典型植被苔草為研究對象,以6種植被光譜指數作為輸入變量,運用R

繼續閱讀