天天看點

農作物病蟲害識别進展概述(***)摘要1 發展概述2 總結

最近看了Overview: Research Progress on Pest and Disease Identification這篇文章,這篇文章主要也就是對農業病蟲害的識别的一個綜述。

摘要

近年來,病蟲害的識别已成為一個熱門話題。越來越多的研究者開始研究病蟲害的檢測和識别,以實作精準農業。自動檢測該地區農作物上的害蟲數量已經成為優化農業資源的重要手段。随着現代數字技術的發展,圖像處理技術也發展迅速,為有害生物的識别開辟了新的途徑。在農業種植過程中,及時準确地分析作物病蟲害,以便做出快速準确的反應,在受影響的區域準确噴灑農藥,確定農藥的高效使用,實作高産。本文第二部分将介紹害蟲識别的研究進展,包括病蟲害識别、害蟲數量和位置檢測、現有資料集。在第三部分,本文将介紹以前文章中使用的一些方法。第四部分總結。

1 發展概述

1.1 病蟲害識别和分類

病蟲害識别對精準農業具有重要的意義。過去ML和DL對貓狗的識别已經取得了很不錯的識别效果。是以,學者們将ML和DL技術應用到了農作物的病蟲害識别上來了,并且在病蟲害識别上已經取得了很不錯的進展。

  1. 2010年,該方法由Al-Bashish等人提出[1]試圖鑒别五種不同的植物病害:Early scorch, Cottony mold, ashen mold, late scorch, tiny whiteness。預處理階段降噪後的圖像,采用K均值聚類算法将圖像分為四類。對于每個聚類,通過HSI顔色空間共現方法提取許多顔色和紋理特征,并将這些特征輸入到具有10個隐藏層的MLP神經網絡中,最後進行分類。
  2. 2014年,Rothe等人[2]提出了一種通過從數字圖像中提取葉片症狀來自動分類棉花葉片病害的方法。Otsu的分割方法用于提取顔色和形狀特征。支援向量機(SVM)對提取的特征進行分類。該系統将有助于鑒定三種葉部病害,即Bacterial Blight, Myrothecium and Alternaria。如果映像失敗,系統的效率可能會受到影響。此外,這項工作可以擴充到開發混合算法,如遺傳算法和神經網絡,以提高分類的準确性。
  3. 2016年,Sladojevic等人[3]使用深度卷積網絡開發了一種基于葉片圖像分類識别植物病害的新方法。本文建立的模型可以從健康葉片中識别13種不同類型的植物病害,并從周圍環境中識别植物葉片。作者不僅收集了圖像并建立了資料庫,還全面描述了模組化所需的所有基本步驟。對于單獨的類測試,實驗結果達到了91%到98%之間的精度。訓練後模型的最終總準确率為96.3%。
  4. 在2017年,Wang等人[4]利用PlantVillage資料集中的蘋果black rot圖像将蘋果葉片分為4種類型:健康期、早期、中期和末期。沒有複雜的圖像預處理,訓練和測試可以在裁剪和歸一化後進行。在少量訓練樣本的基礎上,訓練不同深度的小卷積神經網絡,并對最新的4種深度模型進行微調:VGG16、VGG19、Inception-v3和ResNet50。結果表明,微調預先訓練的深度模型可以顯著提高少量資料的性能。微調後的VGG16模型性能最好,在測試集上的準确率為90.4%。
  5. 2017年,Ramcharan等人[5]應用遷移學習來訓練DCNN,使用在坦尚尼亞拍攝的木薯(cassava)疾病圖像資料集來識别三種疾病和兩種類型的害蟲損害(或沒有害蟲)。當使用Inception-v3模型時,達到最高精度,包括褐斑病(brown leaf spot BLS) 98%,紅螨病(red mite disease RMD) 96%,綠螨病( green mite disease GMD) 95%,木薯褐條病(cassava brown streak disease CBSD) 98%和木薯花葉病(cassava mosaic disease CMD) 96%。對于訓練過程中未使用的資料,最佳模型的總體準确率為93%。本研究開發的卷積神經網絡模型已應用于安卓系統,對檢測裝置的小型化具有重要意義。
  6. 2018年,Nanni等人[6]提出了一種基于顯著性方法和卷積神經網絡融合的自動分類器。顯著性方法是一種著名的突出圖像中最相關的像素圖像處理算法。本文采用三種不同的顯著性方法作為圖像預處理,并為每種顯著性方法訓練四種不同的卷積神經網絡。實驗發現,最好的獨立網絡是不經過預處理的ShuffleNet。
  7. 2018年,Alfarisy等人[7]基于印度尼西亞病蟲害對水稻生産構成威脅的事實,建立了一個水稻圖像資料集來同時檢測水稻病蟲害,以解決水稻病蟲害的準确檢測問題。這篇論文使用搜尋引擎收集了來自四種語言的4511張圖檔。該資料集可識别13種水稻病蟲害,其中9種為水稻病蟲害,4種為水稻病害。本文利用深度學習對印度尼西亞稻田病蟲害進行分類。選擇Caffe架構進行處理,并使用預先教育訓練的CaffeNet模型。實驗結果準确率達到87%。
  8. 2018年,Wang等人[8]提出了一種基于遷移學習的害蟲檢測和識别系統,為控制害蟲和病害以及準确噴灑農藥提供了依據。該方法能訓練和檢測10種茶樹害蟲,準确率為93.84%,為人類專家和傳統神經網絡提供了一種新的途徑。是以,為精準農業提供了可靠的技術支援。為了驗證模型的廣泛适應性,采用兩種雜草對模型進行訓練和測試,準确率達到98.92%。然而,本文還沒有開發出一種技術來實際處理由不同裝置和人在不同角度、照明和不同環境條件下捕獲的圖像。
  9. 2019年,Liu等人[9]提出了一種基于區域的端到端方法,稱為PestNet,用于基于深度學習的大規模多類害蟲檢測和分類。PestNet包含三個主要部分:通道-空間注意(CSA),區域建議網絡(RPN),位置敏感分數圖(PSSM)。CSA首先被內建到卷積神經網絡(CNN)主幹中,用于特征提取和增強。接下來,使用RPN擷取害蟲位置。PSSM被用來代替害蟲分類和包圍盒回歸的完全連接配接層。此外,本文将上下文RoI作為害蟲特征的上下文資訊,以提高檢測精度。他們在新收集的大規模害蟲圖像資料集上對PestNet進行了評估,實驗結果表明,所提出的PestNet在檢測多種類型的害蟲方面表現良好,平均準确率(mAP)為75.46%。
  10. 2019年,Mishraetal等人[10]認為光線、複雜的背景和部分可見或不同方向的害蟲會導緻錯誤分類,進而導緻巨大的交叉。為了減少由部分可見或不同方向的害蟲的錯誤分類,并減輕由光、複雜背景和背景幹擾引起的錯誤分類。以農作物價格為例,該公司推出了一個害蟲識别系統,可以對田間的害蟲進行分類,而不管它們的方向如何。傳感器,如照相機(手機)或基于杆的熱傳感器,可用于提供圖像為了morphological edge detection and bone processing。訓練有素的分類器可以識别有害或完好的部分,并使用CNN作為分類器來提高準确性。與其他流行的分類器相比,如SVM、樸素貝葉斯等,它産生了更好更快的結果。

1.2 害蟲的數目統計與位置檢測

害蟲的數量是嚴重性的基礎。害蟲數量和位置的檢測為高效使用農藥奠定了基礎,對實作精準農業具有重要意義。

  1. 2016年,劉等人[11]證明了使用基于顯著性的方法定位自然圖像中的害蟲對象的有效性。害蟲定位和分類管道首次實施。首先,他們使用一種基于全局對比度的方法來計算一個顯著的地圖來定位害蟲對象。然後提取包含目标的包圍盒并調整到固定大小,然後用于建構一個大型标準資料庫,稱為“害蟲ID”該資料庫用于學習局部圖像特征,以便通過DCNN進行分類。該DCNN優化了關鍵參數,平均精度達到0.951。
  2. 2016年,丁格塔爾[12]提出了一種基于滑動視窗的檢測管道,用于自動監控誘捕圖像中害蟲的位置和數量。他們将CNN應用于不同位置的圖像塊,以确定包含特定害蟲類型的可能性。然後,根據圖像塊的位置和相關置信度,對圖像塊進行非最大抑制和門檻值濾波,得到最終的檢測結果,證明了該方法的有效性。
  3. 2018年,鐘等人[13]提出了一種新的基于視覺的飛行昆蟲統計與識别系統。該系統在監控區域安裝黃色粘性誘捕器誘捕飛蟲,并設定攝像頭采集實時圖像。YOLO深度學習網絡用于檢測和粗略計數飛蟲。SVM用于飛蟲分類。該系統在樹莓派上實作。為了評估性能,使用六種昆蟲來驗證系統的有效性。實驗結果表明,在樹莓派系統上,平均計數準确率為92.5%,平均分類準确率為90.18%,檢測識别周期為5分鐘。與傳統的基于氣候處理的害蟲檢測系統不同,該系統可以實時監測害蟲的發生情況,預測病蟲害的發生機率和發展趨勢,在農業領域具有重要意義。
  4. 2019年,利塔爾[14]提出了一種改進的深度學習方法來定位和統計圖像中的農業害蟲,以解決害蟲破壞農作物的問題。本文中将ZF的CNN與一個非最大抑制(NMS)的區域提議網絡(RPN)相結合,以消除重疊檢測。首先,使用ZFNet網絡中的卷積層(沒有平均池化層和全連接配接層)去計算圖像的特征圖,較小的卷積核可以更好地保留原始的像素資訊;然後,對該過程的幾個關鍵參數進行優化,包括輸出尺寸、門檻值評分、NMS門檻值等。此方法的準确率為0.93,漏檢率為0.1,平均準确率為0.885,比AlexNet和ResNet網絡更實用。最後,提出了今後值得改進的4點:(1)通過改變訓練對象的背景來增強訓練資料集;(2)添加更多的網絡層幫助模型從圖像中學習到更多的特征;(3)使用大規模的資料集的不同尺寸的圖像去訓練模型以此來改善訓練的模型;(4)識别麥子的不同生長過程并評估危害水準。

1.3 農業病蟲害現有資料集

1.3.1 IP102資料集

病蟲害識别相關資料集的問題:

  1. 樣本或病蟲害種類數量少;
  2. 公共資料集中的大多數現有問題都是在受控的實驗室環境中收集的,沒有很好地滿足實際環境中害蟲識别的要求;
  3. 不同種類的害蟲在外觀上可能非常相似,但同一害蟲可能有不同的形态,包括卵、幼蟲、蛹和成蟲,即類間差異顯著,種間相似性大。

是以收集了IP102資料集,用于病蟲害識别,包含102個類别和75000張圖像。與以前的資料集相比,IP102符合真實環境中害蟲分布的幾個特征。文章對資料集的一些方法進行了評價,結果表明,目前的人工特征方法和深度學習方法仍然不能很好地處理害蟲識别。

IP102資料集大緻如下表所示:

農作物病蟲害識别進展概述(***)摘要1 發展概述2 總結

1.3.2 IDADP資料集

農業害蟲研究圖書館(IDADP)擷取資料集:該資料集有水稻、小麥和玉米三種作物的15中病蟲害,每一類病蟲害對應一個檔案夾,水稻疾病有6個檔案夾,小麥疾病有5個檔案夾,玉米疾病有4個檔案夾。每個檔案夾包含疾病圖像的原始JPG檔案,以及描述疾病基本資訊和預防方法的文本檔案。資料集共有17624張高品質的圖像資料。

IDADP資料集大緻如下表所示:

農作物病蟲害識别進展概述(***)摘要1 發展概述2 總結

1.4 識别與分類的常用方法

1.4.1 KNN(k-Nearest Neighbors最近鄰分類算法)

K-nearest Neighbor (KNN)分類算法是理論上比較成熟的方法,也是最簡單的機器學習算法之一。這種方法的思想是:如果特征空間中最相似的k個樣本(即特征空間中最相鄰的樣本)大部分都屬于某一類别,那麼該樣本也屬于這一類别。在KNN算法中,所選的鄰居都是經過正确分類的對象。該方法根據最相鄰的樣本或幾個樣本的類别來确定子樣本的類别。詳情請戳:機器學習之KNN(k近鄰)算法詳解

1.4.2 SVM(Support V ector Machine支援向量機)

支援向量機(Support V ector Machine, SVM)是一種根據監督學習對資料進行分類的廣義線性分類器,其決策邊界是學習樣本的最大邊界超平面。支援向量機利用鉸鍊損失函數來計算經驗風險,并在求解系統中加入正則化項來優化結構風險。它是一種具有稀疏性和魯棒性的分類器。支援向量機可以通過核方法進行非線性分類,這是一種常用的核學習方法。支援向量機(SVM)提出于1964年,20世紀90年代後迅速發展,衍生出一系列改進和擴充的算法,已應用于人像識别、文本分類等模式識别問題。詳情請戳:支援向量機(SVM)入門了解與推導

1.4.3 NB(Naive Bayes樸素貝葉斯分類算法)

樸素貝葉斯分類(NBC)是基于貝葉斯定理的方法,假設特征條件互相獨立。首先,通過給定的訓練集,以特征詞之間的獨立性為前提,學習從輸入到輸出的聯合機率分布。根據學習的模型,輸入X找到使後驗機率最大的輸出Y。詳情請戳:帶你了解樸素貝葉斯分類算法

1.4.4 CNN(Convolutional Neural Networks卷積神經網絡)

多層感覺器(MLP)也被稱為人工神經網絡(神經網絡)。除了輸入輸出層之外,它們之間還可以有多個隐藏層。最簡單的MLP需要一層隐藏層,即輸入層、隐藏層和輸出層。人工神經網絡是一種通用分類器,在許多領域都有應用。與其他分類器相比,人工神經網絡的優勢在于它可以自己從對象中提取所有特征,即不需要額外的特征提取。用于圖像處理的最流行的人工神經網絡版本被稱為卷積神經網絡。CNN是一個深度前饋神經網絡,通過使用多層感覺器來幫助可視化圖像。

AlexNet(2012):

AlexNet是由2012年ImageNet競賽的獲勝者Hinton和他的學生Alex Krizhevsky設計的。AlexNet包含了一些較新的技術,并且首次成功應用了trick在CNN上,例如:ReLU,Dropout和LRN。同時,AlexNet也使用GPU進行計算加速。AlexNet推廣了LeNet,并将CNN的基本原則應用到一個非常廣泛的網絡上。

VGG(2014):

VGG模型是2014年ILSVRC競賽的第二名,第一名是GoogLeNet。但是VGG在多個遷移學習任務上的性能比GoogLeNet更好。此外,從圖像中提取CNN特征,VGG模型是最佳算法。其缺點是參數量高達140M,需要更多的存儲空間。但是這個模式很有價值。

ResNet(2016):

ResNet(殘差神經網絡)是由微軟研究院的何開明等人提出的。利用ResNet單元成功訓練152層神經網絡,獲得ILSVRC2015競賽冠軍。參數量低于VGGNet,效果非常顯著。該結構可以加快神經網絡的訓練速度,大大提高了模型的精度。

GoogLeNet(2015):

GoogLeNet獲得了2014年ILSVRC競賽的第一名。GoogLeNet在網絡結構上做了更大膽的嘗試,雖然深度隻有22層,但規模遠遠小于AlexNet和VGG。GoogLeNet的參數是5M,AlexNet的參數是GoogLeNet的12倍,VGGNet的參數是AlexNet的3倍,是以當記憶體或計算資源有限時,GoogLeNet是很好的選擇。

ShuffleNet(2018):

ShuffleNet是一種高效的CNN架構,特别适用于計算能力有限的移動裝置。它使用兩個操作:點組卷積和通道洗牌。與現有的先進模型相比,大大減少了計算量,精度相近。ShuffleNet顯示優越的性能在ImageNet和MS COCO超過其他先進的模型。

MobileNetv2(2018):

MobileNetv2體系結構基于反向殘差結構。原始的殘差結構有三個卷積,兩個逐點卷積通道有更多的通道。反向的殘差結構恰恰相反。研究發現,去除主分支中的非線性變換是有效的,可以保持模型的表達性。在ImageNet、COCO、VOC上進行了對比實驗,驗證了該架構的有效性。

1.4.5 TL(Transfer Learning遷移學習)

遷移學習是一種機器學習方法,指的是在另一個任務中重用一個預先訓練好的模型。遷移學習與多任務學習和概念漂移有關。它不是一個專門的機器學習領域。遷移學習在某些深度學習問題中非常流行,例如訓練一個深度模型需要大量的資源,或者使用大量的資料集對模型進行預訓練。詳情請戳:遷移學習概述

2 總結

基于本文中的相關文獻可知:

  1. 目前關于農業病蟲害大多數的研究者都是基于較小的資料集,包含的樣本或害蟲種類很少;
  2. 大部分害蟲圖像都是在受控條件下獲得的,無法滿足實際環境中病蟲害識别的要求,以上會導緻模型的實際實用性不高;
  3. 目前的文獻隻是片面地研究害蟲和疾病的識别,害蟲的定位和計數,或者疾病嚴重程度的判斷,缺乏相關研究來識别病蟲害,定位和計數害蟲,同時确定疾病的程度,進而實作精準農業。

繼續閱讀