天天看點

工業機器視覺系統相機如何選型?(理論篇—3)

目錄

1、圖像基礎知識

1.1、圖像類型

1.2、圖像分别率、系統分辨率和像素分辨率

1.3、視場

2、影響成像品質的因素

3、成像系統模型

4、鏡頭系統簡化模型

5、鏡頭與相機的選型

5.1、鏡頭的選型

5.1.1、鏡頭分辨率

5.1.2、鏡頭成像要素

5.1.3、普通鏡頭和遠心鏡頭

5.2、相機的選型

5.2.1、CCD/CMOS

5.2.2、模拟相機和數字相機

6、總結

數字圖像是機器視覺系統工作的前提和基礎,工業機器視覺系統把成像子系統的信号轉換為反映現實場景的二維數字圖像,并對其進行分析、處理,得出各種指令來控制機器的動作。

圖像是指所有具有視覺效果的畫面,它是對客觀對象的一種相似的、生動的描述。

根據色彩不同,圖像可以分為彩色圖像和黑白(灰階)圖像。通過對人眼結構及特性的研究發現,人眼對紅(R)、綠(G)、藍(B)3種顔色特别敏感,不同強度的RGB混合後刺激視網膜上的錐狀體,使人眼可以感覺自然界中的幾乎所有色彩。反過來,自然界中的色彩可以分解為不同強度RGB基本色的組合,這種表示色彩的方式稱為RGB顔色模型或RGB色彩空間,如下圖所示:

工業機器視覺系統相機如何選型?(理論篇—3)

相應地,也可以将彩色圖像的研究分解為對RGB分量所對應的灰階圖像的研究。

圖像根據記錄方式的不同可分為模拟圖像和數字圖像兩大類。

如果将灰階圖像看作二維空間上的光強度函數f (x,y),則模拟灰階圖像就是對該空間上光強度幅值f變化的連續記錄。當(x,y)和f為離散、有限的數值時,光強度幅值f的變化将以類似矩陣的形式被記錄,此時所記錄的圖像就稱為數字圖像,而所記錄的值對應在圖像中的每個點稱為像素(pixel),橫向及縱向像素的個數稱為圖像的分辨率(image resolution),如果是彩色數字圖像,則在計算機中需要記錄每個像素對應的RGB分量,如下圖所示:

工業機器視覺系統相機如何選型?(理論篇—3)

工業機器視覺系統中提及的圖像通常就指數字圖像。

圖像分辨率、系統分辨率和像素分辨率是機器視覺系統設計時較常見的參數,它們通常與客戶對機器視覺系統的需求關系最為密切,是選擇相機和鏡頭的重要依據。

圖像分辨率指圖像中存儲的資訊量,是每英寸圖像内有多少個像素點,分辨率的機關為PPI(Pixels Per Inch),通常叫做像素每英寸。圖像分辨率一般被用于PS中,用來改變圖像的清晰度。

系統分辨率指成像系統可以識别出監測目标的最小細節或最小特征。諸如“要求系統能檢測0.1mm的目标"、"要求系統測量精度達到0.01mm"之類的要求一般都和系統分辨率相關。

像素分辨率指為了表示檢測目标所需要的像素數。一般情況下,可以根據客戶對檢測目标中最小特征的要求來确定最小像素分辨率。如果将整個圖像看作周期為最小特征大小的周期信号,則根據奈奎斯特采樣定律,必須對信号每個周期采樣2個點以上,才能完整恢複該信号。是以如果客戶沒有特别要求,常用至少兩個像素來代表檢測目标中的最小特征,這可被看作是圖像傳感器的奈奎斯特定律。

圖像傳感器應具備的最小像素分辨率常通過下面的公式計算:

工業機器視覺系統相機如何選型?(理論篇—3)

Rmin為最小像素分辨率。

Lmax為檢測目标的最大長度。

lmin為檢測目标的最小特征長度(視覺系統的分辨率)。

pmin為表示最小特征的像素數。

在無特别要求時,pmin=2,如果客戶要求使用多于2像素來表示最小特征,則最小分辨率将适當增加。

視場(Field of View,FOV)指成像系統中圖像傳感器可以監測到的最大區域。在機器視覺系統設計時,考慮到一般都會使被檢測目标盡量填滿整視場,是以常用視場大小代替目标的最大長度Lmax來計算視覺系統的像素分辨率。如下圖(a)所示,表示被檢測目标在水準方向上占據整個視場,而圖(b)表示目标未填滿視場。

工業機器視覺系統相機如何選型?(理論篇—3)

如果橫縱方向上視場大小為[FOVh,FOVv],檢測目标的最小特征的大小為[Ih,lv],則圖像傳感器應具有的最小像素分辨率為:

工業機器視覺系統相機如何選型?(理論篇—3)

成像系統視場的大小可以通過研究其成像規律得知。目前,機器視覺系統常用使用配備各種鏡頭系統的工業CCD/CMOS相機作為成像系統,透鏡成像示意圖如下所示:

工業機器視覺系統相機如何選型?(理論篇—3)

鏡頭系統一般使用透鏡系統,其成像遵循高斯成像公式:

工業機器視覺系統相機如何選型?(理論篇—3)

f為透鏡焦距(focal length,凸正凹負)。

u為物距。

v為像距(實正虛負)。如下圖所示。通常将像距與物距的比值定義為透鏡的放大率M:

工業機器視覺系統相機如何選型?(理論篇—3)

數字圖像是對成像系統輸出的信号進行數字化後的結果,成像系統反映真實場景的性能和品質直接決定整個機器視覺系統的性能。

影響機器視覺成像系統成像品質的因素主要包括:光源(Illumination)、系統分辨率(System Resolution)、像素分辨率(Pixel Resolution)、對比度(Contrast)、景深(Depth of Field,DOF)、投影誤差(Perspective Error)和鏡頭畸變(Lens Distortion)。

而這些因素(參數)卻直接或間接地由硬體選型和安裝方式決定。

工業或研究領域的成像系統多種多樣,常見的有工業CCD/CMOS相機、工業顯微鏡、生物顯微鏡、X射線成像儀、紅外成像儀、熱成像儀等。無論這些成像系統的原理有多複雜,都可被抽象為下圖所示的簡化模型。

工業機器視覺系統相機如何選型?(理論篇—3)

千差萬别的成像系統對現實世界中的可見光、紅外、X射線、熱量等實施某種轉換T (x,y),将實體量轉換為電信号,再經圖像采集裝置采樣、量化後生成數字圖像。

由于對機器視覺成像系統來說,相機鏡頭到所檢測目标的距離(稱為工作距離,相當于物距)相對于相機焦距可近似認為是無窮遠。若将其帶入高斯成像公式,可得出此時相機像距近似等于其焦距,也就是說相機成像在焦平面上。據此,可以将鏡頭系統抽象為類似小孔成像的簡化模型,如下圖所示:

工業機器視覺系統相機如何選型?(理論篇—3)

根據該簡化模型,可以得出機器視覺系統圖像傳感器尺寸S(傳感器平面某個方向上的長度)、視場FOV、工作距離WD及鏡頭焦距f之間的限制關系:

工業機器視覺系統相機如何選型?(理論篇—3)

此時,透鏡的放大率M則可以等效為:

工業機器視覺系統相機如何選型?(理論篇—3)

如果進一步将前述最小像素分辨率的計算公式與該限制關系結合(用視場FOV代替目标的最大長度Lmax),則可以得出以下成像系統簡化模型的參數限制關系:

工業機器視覺系統相機如何選型?(理論篇—3)

該公式所顯示的參數間的互相限制關系是機器視覺系統設計和搭建部署時系統設計和裝置選型的基礎。

實際中傳感器尺寸S可以通過查詢相機的技術規範獲知,焦距f、工作距離WD直接由所選擇的鏡頭決定。在已知這些參數時,可以很容易地計算出視場FOV。相機的像素分辨率由其有效像素區域(即傳感器尺寸)決定,通常用橫向和縱向有效像素數來表示(如768×576)。為機器視覺系統所選擇的相機像素分辨率,必須大于或等于按照項目需求(包括對最小特征尺寸lmin和用于表示最小特征的像素數pmin的要求)計算出的最小像素分辨率Rmin。下圖進一步顯示了公式中涉及的參數含義:

工業機器視覺系統相機如何選型?(理論篇—3)

工業機器視覺系統中,鏡頭與相機的選型非常重要。如果事先既未确定相機又未确定鏡頭,則需要先了解項目工作環境對相機安裝(工作距離)、要檢測的最大範圍(視場)、最小特征的尺寸和代表它的像素數的要求,然後根據這些條件來計算應使用何種鏡頭或相機。下圖為機器視覺項目選擇鏡頭和相機的簡化流程:

工業機器視覺系統相機如何選型?(理論篇—3)

無論何種情況,都是基于成像系統簡化模型的參數限制關系和項目需求擷取最優搭配的過程。

如果将機器視覺系統與人類視覺系統進行類比,那麼相機的傳感器晶片就如同人的視網膜,而鏡頭則相當于眼睛内的晶狀體。各種現實世界中的圖像都通過這個“晶狀體"對光線進行變換(彙聚)後,投射在"視網膜”上。

機器視覺成像系統使用的鏡頭通常由凸透鏡和凹透鏡結合設計而成。

單個凸透鏡或凹透鏡是進行光束變換的基本單元。凸透鏡可對光線進行彙聚,也稱為會聚透鏡或正透鏡。

凹透鏡對光線具有發散作用,也稱為發散透鏡或負透鏡。

兩種透鏡成像均遵循高斯成像公式,通過把它們結合使用,在校正各種像差和失真後,設計出具有不同結構和技術名額的複合鏡頭系統。與鏡頭相關的主要技術參數有鏡頭分辨率、焦距、最小工作距離、最大像面、視場/視場角、景深、光圈和相對孔徑及其安裝接口類型等。

鏡頭的空間分辨率、相機像素分辨率和相機的空間分辨率、系統空間分辨率和系統分辨率是幾個極容易混淆的概念。

鏡頭空間分辨率表示它的空間極限分辨能力,常用拍攝正弦光栅的方法來測試。如果從信号處理的角度來看,任何非周期圖像信号都可以被看作周期圖像(或子圖像)的疊加,而任何周期圖像又都可以被分解為亮度按正弦變化的圖形的疊加。是以,通過研究鏡頭對亮度按正弦變化圖形的反應,就可以研究鏡頭的性能和分辨率。正弦光栅就是亮度按照正弦變化的圖像,如下圖所示:

工業機器視覺系統相機如何選型?(理論篇—3)

其中棚格黑白相間,可把黑色看作正弦波谷,把白色看作正弦波峰。正弦光栅中一對相鄰黑線和白線稱為一個線對(line pair,lp),它所占據的長度被定義為正弦光栅的空間周期,機關是毫米。正弦光栅空間周期的倒數就是空間頻率(spatial frequency),它表示每毫米内的線對數,機關是線對/毫米(Ip/mm)。通過拍攝正弦光栅,研究鏡頭每毫米内能分辨的線對數,就可以獲知鏡頭的分辨率。鏡頭分辨率越高,則說明其每毫米内能分辨的線對數越多。對于機器視覺系統設計來說,隻需要查詢鏡頭參數表即可獲知其分辨率。

相機像素分辨率是指相機傳感器上縱橫方向上的像素數。

相機的空間分辨率卻表示它的空間極限分辨能力。根據前述相機奈奎斯特定律,相機要能恢複空間圖像,必須至少使用2個像素來表示圖像的最小單元。如果用研究鏡頭的空間分辨率類似的方法來研究相機空間分辨率,則正弦光栅中的每對線需要至少2個像素來表示。由此,可以通過像素的實體大小來計算相機的空間分辨率。例如,某相機的像素實體大小為8.4um×9.8um,則相機在橫縱方向上的空間分辨率為:

工業機器視覺系統相機如何選型?(理論篇—3)

對于鏡頭和相機構成的成像系統來說,整個系統的空間分辨率取鏡頭和相機空間分辨率的最小值。

影響鏡頭成像的因素包括:焦距、最大像面、視場/視場角、漸暈、景深等方面。

焦距是指無限遠處目标在鏡頭的像方所成像位置到像方主面的距離。焦距展現了鏡頭的基本特性:即在不同物距上,目标的成像位置和成像大小由焦距決定。市面上常見的鏡頭焦距大小包括6mm、8mm、12.5mm、25mm以及50mm等。對機器視覺成像系統來說,工作距離就是成像系統中所說的物距。由于視覺成像系統模型的假定條件是工作距離相對于鏡頭焦距為無限遠,是以一般在鏡頭的産品參數中都會說明其最小工作距離。當相機在小于該最小工作距離的環境下工作時,就會出現圖像失真,影響機器視覺系統的可靠性。

最大像面是指鏡頭能支援的最大清晰成像範圍(常用可觀測範圍的直徑表示),超出這個範圍所成的像對比度會降低而且會變得模糊不清。最大像面是由鏡頭本身的特性決定的,它的大小也限定了鏡頭可支援的視場的大小。

鏡頭的視場就是鏡頭最大像面所對應的觀測區域。視場角是視場的另一種表述方法,類似人眼“視角"的意義。視場角等于最大像面對應的目标張角。通常,在遠距離成像系統中,例如望遠鏡、航拍鏡頭等場合,鏡頭的成像範圍均用視場角來衡量。而近距離成像中,常用實際物面的直徑(即幅面)來表示。

由于機器視覺成像系統中的傳感器多制作成長方形或正方形,是以鏡頭的最大像面常用它可以支援的最大傳感器尺寸(機關為英寸,1英寸約為2.54cm)來表示。相應地,鏡頭的視場也可以用最大像面所對應的橫向和縱向觀測距離或視場角來表示,如下圖所示:

工業機器視覺系統相機如何選型?(理論篇—3)

對于同一相機來說,有公式如下:

工業機器視覺系統相機如何選型?(理論篇—3)

S為相機傳感器在二維平面某個次元上的大小。

f為焦距。

2w為視場角。

由于相機傳感器尺寸固定,是以視場角也可以被看作焦距的另一種表達。是以在生活中,人們常按照鏡頭的視場角對其進行分類,如望遠鏡(6~12°)、遠距攝像鏡頭(120~46°) .标準鏡頭(46~65°)、廣角鏡頭(650~100°)及超廣角鏡頭( >100°)等。

一般來說,鏡頭的失真會随着焦距的減小(或視場角的增大)而增大,因而在建構機器視覺系統(特别是精确測量系統)時,一般都不會選擇焦距小于8mm或視場角很大的鏡頭。

鑒于鏡頭能清楚成像的範圍受到最大像面的限制,是以在為相機選配鏡頭時,要特别注意相機傳感器與鏡頭可支援最大傳感器之間的關系。

一般來說,必須確定所選鏡頭可支援的最大傳感器尺寸大于或等于相機的傳感器尺寸。這樣做的另一個主要原因是為了避免漸暈(Vignetting)現象的發生。

如圖下圖(c)所示,如果相機傳感器的尺寸大于鏡頭可支援的最大傳感器尺寸時,所生成的圖像就會形成類似隧道的效果,該現象稱為漸暈現象。漸暈現象會增加機器視覺系統的開發難度,是以應盡量避免。下圖中的(a) 、(b)分别顯示了在鏡頭可支援的最大傳感器尺寸等于或大于相機的傳感器尺寸時視覺系統的成像情況,這兩種情況下機器視覺系統均能正常工作。

工業機器視覺系統相機如何選型?(理論篇—3)

景深也是一個與鏡頭和成像系統關系十分密切的參數,它是指在鏡頭前沿着光軸所測定的能夠清晰成像的範圍,如下圖所示:

工業機器視覺系統相機如何選型?(理論篇—3)

在成像系統的焦點前後,物點光線呈錐狀開始聚集和擴散,點的影像沿光軸在焦點前後逐漸變得模糊,形成一個擴大的圓,這個圓稱為彌散圓(circle of confusion)。若這個圓形影像的直徑足夠小(離焦點較近),成像會足夠清晰,如果圓形再大些(遠離焦點),成像就會顯得模糊。當在某個臨界位置所成的像不能被辨認時,則該圓就被稱為容許彌散圓(permissible circle of confusion)。焦點前後兩個容許彌散圓之間的距離稱為焦深。在目标物一側,焦深對應的範圍就是景深。

工業機器視覺系統相機如何選型?(理論篇—3)

為容許彌散圓的直徑。

f為鏡頭焦距。

D為對焦距離。

F為鏡頭的拍攝光圈(aperture)值。光圈值F常用鏡頭焦距和鏡頭入瞳的有效直徑Din的比值來表示,它是鏡頭相對孔徑Dr的倒數,即:

工業機器視覺系統相機如何選型?(理論篇—3)

從景深公式可以看出,後景深要大于前景深,而且景深一般随着鏡頭的焦距、光圈值、對焦距離(可近似于拍攝距離)的變化而變化。在其他條件不變時:

光圈越大(光圈值F越小),景深越小;光圈越小(光圈值F越大),景深越大。

鏡頭焦距越長,景深越小;焦距越短,景深越大。

距離越遠,景深越大;距離越近,景深越小。

在檢測目标的高度在一定範圍内可能變化的情況下,選擇合适的景深,對于機器視覺系統的穩定性尤為重要。

普通鏡頭與人眼一樣,觀測物體時都存在"近大遠小”的現象,如下圖 (a)所示。也就是說,雖然物體在景深範圍内可以清晰成像,但是其成像卻随着物距增大而縮小。如果被測目标不在同一物面上(如有厚度的物體),則會導緻圖像中的物體變形。另一方面,相機傳感器的感光面通常并不容易被精确調整到與鏡頭的像平面重合(調焦不準),由此也會産生誤差。為此,人們設計了遠心鏡頭。

遠心鏡頭(telecentric lens)有較大的景深,且可以保證景深範圍内任何物距都有一緻的圖像放大率,如下圖 (b)所示。多數機器視覺在測量、缺陷檢測或者定位等應用上,對物體成像的放大倍率沒有嚴格要求,一般隻要選用畸變較小的鏡頭,就可以滿足要求。但是,當機器視覺系統需要檢測三維目标(或檢測目标不完全在同一物面上)時,就需要使用遠心鏡頭。

工業機器視覺系統相機如何選型?(理論篇—3)

例如,要檢測厚度大于視場直徑的1/10的物體,或需要檢測帶孔徑、三維的物體等。一般來說,如果被測目标物面變化範圍大于視場直徑的1/10時,就需要考慮使用遠心鏡頭。它可以確定測試過程中物距在一定範圍内改變時,系統放大倍數保持不變,進而保證系統的測量精度。

早期的相機多基于顯像管成像。随着內建電子技術和固體成像器件的發展,以電荷耦合器件(Charge Coupled Device,CCD)為傳感器的相機,因其與真空管相比具有無灼傷、無滞後、工作電壓及功耗低等優點而大行其道。CCD于1969年由美國貝爾實驗室的Willard S.Boyle和George E.Smith發明,它能夠将光線變為電荷存儲起來,并随後可在驅動脈沖的作用下将存儲的電荷轉移到與之耦合的區域。人們正是利用它的這一特點發明了各種各樣的CCD成像裝置。

CCD實際上可以被看作由多個MOS (Metal Oxide Semiconductor)電容組成。在P型單晶矽的襯底上通過氧化形成一層厚度約為100~150nm的SiOz絕緣層,再在SiO,表面按一定層次蒸鍍一層金屬或多晶矽層作為電極,最後在襯底和電極間加上一個偏置電壓(栅極電壓),即可形成一個MOS電容器,如下圖所示:

工業機器視覺系統相機如何選型?(理論篇—3)

CMOS (Complementary Metal Oxide Semiconductor)圖像傳感器的開發最早出現在20世紀70年代初。20世紀90年代初期,随着超大規模內建電路(VLSI)制造技術技術的發展,CMOS圖像傳感器得到迅速發展。CMOS圖像傳感器的光電轉換原理與CCD圖像傳感器相同,二者的主要差異在于電荷的轉移方式上。CCD圖像傳感器中的電荷會被逐行轉移到水準移位寄存器,經放大器放大後輸出。由于電荷是從寄存器中逐位連續輸出的,是以放大後輸出的信号為模拟信号。在CMOS傳感器中,每個光敏元的電荷都會立即被與之鄰接的一個放大器放大,再以類似記憶體尋址的方式輸出,如下圖所示:

工業機器視覺系統相機如何選型?(理論篇—3)

是以CMOS晶片輸出的是離散的數字信号,之是以采用兩種不同的電荷傳遞方式,是因為CCD是在半導體單晶矽材料上內建的,而CMOS則是在金屬氧化物半導體材料上內建的,工藝上的不同使得CCD能保證電荷在轉移時不會失真,而CMOS則會使電荷在傳送距離較長時産生噪聲,是以使用CMOS時,必須先對信号放大再整合輸出。

CCD和CMOS圖像傳感器比較,如下表所示:

工業機器視覺系統相機如何選型?(理論篇—3)

CCD/CMOS晶片完成光電轉換後,其輸出為模拟或數字電信号。通常該信号還要被進一步放大、矯正,添加同步、調制或采樣編碼,生成符合各種标準的視訊信号後才正式輸出。理論上講,相機的輸出信号可以是任意自定義的形式。但是,由于電視系統先于機器視覺發展多年,若以電視系統中已廣泛使用的視訊方式輸出信号,不僅更便于信号的傳輸,還能最大限度地利用各種現有的成熟軟硬體技術,是以除了少數相機輸出非标準信号外,大多數相機的輸出都是模拟或數字視訊信号。機器視覺相機也是以根據其輸出信号的形式分為模拟相機和數字相機兩大類。

模拟相機的輸出信号通常被加工為可以支援隔行掃描(interlacing scan)顯示的視訊信号,以便其能與傳統電視或視訊監控等系統相容,而多數數位相機的輸出則直接按照支援逐行掃描(progressive scan)的方式進行編碼。我們知道,支援逐行掃描的視訊信号将每一幀圖像按順序逐行連續編碼,傳送到顯示裝置後,也會被逐行以掃描的方式顯示。支援逐行掃描的信号資料量很大,在電視技術發展的初期要通過天線傳輸的此類信号極其困難。為了能減少信号的資料量,同時不影響圖像的視覺效果,人們提出了隔行掃描的方法。

與模拟相機不同,數字相機會通過其内部內建的A/D轉換器将圖像轉換為數字信号,并編碼為數字視訊後,按照RS-422、LVDS (RS-644) 、 FireWire 1394、USB、Camera Link或千兆以太網GigE(Gigabit Ethernet)等标準傳輸。相機中的A/D轉換器位數決定了它能從暗到亮識别的灰階級數,常用位深度(bit depth)來表述,如8位、10位、12位或16位等。

對于彩色相機來說,相機的位深度決定了RGB各色彩分量中灰階資料的豐富程度,也就決定了相機能識别或表示的顔色數量。對黑白相機來說,位深度則直接決定了相機可以識别的灰階級數。

例如,一個8位的黑白數字相機最高能夠檢測0(暗)~256(亮)個灰階級,而一個12位相機則可以檢測0~4096個灰階級。如果要檢測的灰階級間隔比較細,則應盡量使用位數高的相機。例如,若要檢測213和214灰階級之間的灰階級,則應使用超過8位的相機。

數字視訊信号多采用逐行掃描方式代替隔行掃描,且用幀有效(frame enable)和行有效(line enable)信号代替了模拟視訊信号中的場同步和行同步信号,來精确控制每行和每幀圖像。每行中的單個像素都以獨立數字信号的形式,在像素時鐘的控制下傳送,由于數字視訊信号的同步信号(幀有效、行有效和像素時鐘)與圖像資料并沒有像模拟視訊信号那樣混合在一起傳輸,是以數字視訊信号不存在模拟視訊信号的像素抖動問題。此外,數字視訊相對于模拟視訊有較高的分辨率和幀率、較多的灰階等級、高傳輸速度、較低的信号衰減和噪聲等優點。

為機器視覺系統選擇相機,是一個綜合鏡頭和圖像采集卡與相機的接口以及相機自身參數的逐漸篩選的過程。按道理來說,第一步應該确定相機與鏡頭和圖像采集卡的實體接口,以便所選的相機可以與鏡頭和采集卡正常連接配接。但是,由于目前相機與鏡頭和電腦/圖像采集卡之間的接口都趨于标準化,這就使得我們可以直接從項目對機器視覺系統的精度要求入手來選擇相機。

相機選擇并無固定流程可循,根據經驗,應主要從以下幾個方面進行(暫不考慮預算)︰

根據項目要求和機器視覺成像系統模型,确定相機的傳感器尺寸及分辨率。

确定相機的輸出方式及标準(模拟/數字,色彩,速率等)。

确定相機實體接口及電器接口。

确定相機其他性能名額。

繼續閱讀