天天看點

(幹貨)深度學習如何融入工業機器視覺

深度學習是如何火熱起來的

2012年,多倫多大學首次使用深度學習訓練的卷積神經網絡模型在ImageNet的測試表現中取得突破性進展,并引發了一連串的基于卷積神經網絡的優化并不斷大幅提升ImageNet的測試表現。在2015年,通過深度學習訓練的卷積神經網絡模型,在ImageNet的測試表現中,錯誤率已經降到了2.3%,超越了人類的識别準确率,就此推動了在圖像識别領域進行深度學習的大規模産業化應用的熱潮。

(幹貨)深度學習如何融入工業機器視覺

(深度學習技術在2015年超越了人類)

以2012年為起點,各大網際網路巨頭開始落地深度學習技術。2013年,Google通過深度學習來進行街景地圖的門牌号OCR識别;2014年,Facebook将其基于卷積神經網絡模型的人臉識别技術DeepFace大規模地應用于其照片應用之中,識别準确率達到97.3%。目前深度學習被大規模應用于人臉識别、自動駕駛汽車等領域,取得了非常矚目的成績。作為一種首先在消費網際網路領域廣泛應用的技術,是否可以有效融入到工業視覺領域呢?

工業機器視覺需要處理什麼任務

機器視覺作為一種基于2D或者3D相機傳感器的工業自動化技術,在工業視覺領域具有廣泛而成熟的應用。3C、半導體、汽車等行業大量使用機器視覺技術進行異常識别、标簽識别等、物料定位等工作。

工業自動化離不開感覺技術和運動控制技術,就像人離不開眼和手。而人體所獲得的資訊,80%來自于視覺,可想而知,視覺感覺技術一定是工業自動化領域最重要的技術之一。

而傳統機器視覺,是存在明顯局限的。

傳統機器視覺存在什麼局限

傳統機器視覺的圖像處理系統,其工作原理簡單了解起來是這樣:

1、在圖像中找到邊、角等人為定義的目标特征;

2、基于目标特征在圖像中存在與否、多個目标特征之間的距離的數值進行邏輯判斷來完成視覺任務。

(幹貨)深度學習如何融入工業機器視覺

使用這套技術,需要由視覺工程師基于視覺任務的特定需求,進行目标特征的定義以及數值判斷的閥值定義,設計好了之後形成程式由機器執行。​

而傳統機器視覺邏輯簡單的局限性,則展現在無法适用于随機性強、特征複雜的工作任務。典型任務如:

(幹貨)深度學習如何融入工業機器視覺

(随機出現的複雜外觀缺陷檢測)

由于隻能從有限的特征中進行排列組合,視覺工程師無法通過”邊“、”角”來表達“密集的點狀凹凸不平”這種綜合的、複雜的判斷目标。或者表達能力很差,導緻識别準确度不好。是以,傳統機器視覺是無法解決以上問題的。

而這樣的複雜特征問題,恰恰是深度學習技術最擅長解決的問題。​

深度學習如何解決複雜特征問題

相比傳統機器視覺通過視覺工程師來設計算法模型,深度學習技術最大的不同在于,程式能夠自主發現需要用什麼特征,通過什麼樣的邏輯關系來完成圖像分析任務,實作由程式來設計算法模型。

以樂高積木來類比的話,在傳統機器視覺裡,人類的工作是從100個樂高元素裡挑出數十個,組裝起來執行人類設計好的邏輯動作,完成相關任務;而深度學習裡,人類告訴機器需要完成的任務,由機器從1億個樂高元素裡,挑出數萬個,組裝起來并選擇需要執行的邏輯動作來完成該任務。其表達能力遠遠高于人類專家。

(幹貨)深度學習如何融入工業機器視覺

(深度學習技術具有遠超人類專家的表達能力)

由于深度學習可以從更多的特征可能性中進行選擇,并自行決定特征之間的邏輯關系,深度學習就具備了通過從海量像素點中,選擇一組特征,并通過這組特征表達‘密集的點狀凹凸不平’的能力。

(幹貨)深度學習如何融入工業機器視覺

(由軟體自主選擇特征以及邏輯組合方式)

在實際應用中,使用深度學習訓練的模型可以準确地對圖檔中的随機缺陷進行識别,并可以準确地将指定的缺陷有效地辨別出來,真正實作了随機性強、特征複雜的随機缺陷的檢測。

(幹貨)深度學習如何融入工業機器視覺

   (通過深度學習可以識别并辨別圖像中的随機缺陷)

正是由于具備了處理這種随機性強、特征複雜的圖像識别問題的能力,深度學習就具備了突破傳統機器視覺技術的局限的可能性。

深度學習能否達到工業精度要求

我們通常會認為,工業應用對于技術精度和穩定性的要求要高于民用技術。是以,在消費領域火熱的深度學習技術,是否能夠滿足工業名額呢?我們以外觀缺陷檢測為例,看看工業檢測具體需要考慮哪些名額。

(幹貨)深度學習如何融入工業機器視覺

(檢測任務的準确率考核矩陣)

漏判率:漏判會直接造成不良品流向終端客戶。是以漏判率要求通常低于 100 PPM。

誤判率:誤判會直接對工業企業的良率造成影響,會造成物料的浪費。企業對誤判率的要求通常要求在1%-5%之間。在漏判率達标的前提下,隻有大幅降低誤判率,才能達到減人的目标。

節拍:不同行業有較大差異,如電子行業的節拍要求在5秒以内,機械加工行業的節拍要求在幾十秒以内。

一方面,深度學習目前的行業普遍技術水準已經能夠達到95%以上的判定準确率。通過平衡漏判率和誤判率,更加嚴格地控制漏判,可以讓漏判率降到100PPM以下,而誤判率降到5%以下。

另一方面,針對節拍的要求,由于目前GPU顯示卡可以達成每秒80祯的圖像處理速度,5秒内可以完成400張圖檔的判定。而一般3C行業的産品較小,隻需要10張以内的照片就可以完成産品的覆寫,比如大的機加工産品,也隻需不到100張圖檔進行産品表面的全覆寫。圖像處理的速度完成可以滿足節拍的要求。

是以總體來看,我們認為深度學習技術已經成熟到可以完成複雜工業視覺任務。

事實上,深度學習已經産品化了

是的。正是基于這樣的一個技術判斷,将深度學習技術融合到傳統機器視覺領域,解決複雜表觀外觀缺陷檢測問題。目前,深度學習軟體已經成功在複雜機加工産品的外觀缺陷檢測、高反光塑膠件産品的外觀缺陷檢測等領域實作了産品化,檢測效果大幅優于傳統目檢人員,完成了連續超過30W件物料無漏判,檢測節拍提升40%,實作了外觀缺陷檢測工作的自動化,用事實證明了深度學習技術可以滿足工業檢測需求。

繼續閱讀