天天看點

【音視訊基礎】(四):俗稱照片的彩色數字圖像二4、圖像的種類5、灰階圖和彩色圖像6、伽馬矯正7、圖像的壓縮編碼8、圖像的檔案格式

上次說到了圖像的三個基本屬性,隻說了一個圖像分辨率,下面開始介紹另外兩個基本屬性。

3.2 第二個屬性:像素深度和阿爾法(α)通道

像素深度其實就是,存儲每個像素所用的位數(科普:1GB=1024MB 1MB=1024KB 1KB=1024B B俗稱位元組 1位元組等于八位,機關bit)。比如一個用RGB三個分量表示的彩色圖像,若每個分量用8位表示,那麼一個像素共用24位表示,我們就說圖像的像素深度為24位

3.2.1 像素深度的意義

像素深度決定了“彩色圖像”的每個像素可能有的顔色數,或者是“灰階圖像”的每個像素可能有的灰階級數。比如當像素深度為24位時,那麼每個像素可以是16777216(2的24次方)種顔色的一種。

對于追求完美的人估計會說,如果我們提高像素深度,那每個像素能顯示的顔色種類不就更多了,圖像也就更細膩更自然了。

理論上确實是這樣,但是一旦我們提高了像素深度,圖像所對應的存儲空間也急劇上升。請注意像素深度是表示一個像素所占的空間,對于一幅分辨率為640x480,像素深度為24位的圖像,它所占的空間為 640 x 480 x 3 = 921600位元組。

而且受到裝置和人眼分辨率的限制,像素深度不一定要特别深。普通人在正常情況下,隻能識别二百多種顔色,多達一千六百多萬種的顔色已然足足夠用。

3.2.2 阿爾法(α)通道

假設一幅圖像的每個像素,用32位來表示,那麼它的最高8位,就稱為8位α通道,其餘24位是顔色通道,紅、綠、藍分量各占一個8位通道。

3.2.3 α通道的作用

它用于表示像素在對象中的透明度(alpha)。比如用兩幅圖像A和B混合成一幅新圖像,那麼新圖像C的像素為:C的像素 = (alpha)x(A的像素) + (alpha)x(B的像素) 。式中的alpha就是α的值。

再舉個例子,如果一個像素用(A,R,G,B)四個分量表示,A表示α的值,取值0到1。則像素值為(1,1,0,0)時表示紅色,并且紅色強度為1,可以了解為完全不透明的紅色。

如果像素值為(0.5,1,0,0),使用0.5乘R、G、B三個分量,得出(0.5,0.5,0,0),表示紅色的強度為0.5,可以了解為紅色半透明。

3.3 第三個屬性:真彩色、僞彩色和直接色

3.3.1 真彩色

這個應該比較好了解,它是指每個像素的顔色值,用RGB表示的顔色。例如用RGB 5:5:5表示圖像顔色,R、G、B各用5位,其值大小,直接确定三個基色的強度。這樣得到的彩色,是真實的原圖彩色。

3.3.2 僞彩色

它指每個像素的顔色值,不是通過R、G、B三個分量直接确定的,而是通過彩色查找表,查找要顯示圖像的R、G、B值,以此來生成彩色。

這樣解釋可能不太好懂,是以我找了個例子。在有僞彩色應用的顯示裝置中,幀緩存顯示圖像的時候,會使用某一顔色值的索引,到彩色查找表裡,查找對應的RGB分量值。流程圖如下

【音視訊基礎】(四):俗稱照片的彩色數字圖像二4、圖像的種類5、灰階圖和彩色圖像6、伽馬矯正7、圖像的壓縮編碼8、圖像的檔案格式

彩色查找表查找顯示

這樣通過查找得到的彩色是真的,但不是圖像本身真正的顔色,它并沒有反應原圖真正的顔色。是以稱為僞彩色

3.3.3 直接色

把每個像素的RGB三個分量,作為單獨的索引值對它做變換,并用變換後的R、G、B值産生顔色。注意重點是變換,至于怎麼變換,可以先忽略。

4、圖像的種類

圖像的種類常分為兩種,這裡說的種類,并不是指png、jpeg,這是圖像的格式,而不是種類。圖像的種類是指,表示圖像所用的方法。

4.1 位圖

在之前的時候,曾多次重複過栅格圖像這個概念(因為是寫系列文章,是以我不再重複啦)。

在描述一幅圖像的時候,作為普通人,我們所認知的圖像,多數是比如人物、風景等存在手機裡的圖檔,這樣的圖像是使用栅格圖像的方法來描述的。每幅圖像,都由許多像素組成,就像我們小時候玩的拼圖。

【音視訊基礎】(四):俗稱照片的彩色數字圖像二4、圖像的種類5、灰階圖和彩色圖像6、伽馬矯正7、圖像的壓縮編碼8、圖像的檔案格式

位圖

如果作為普通使用者,我們就會想,圖像不都是這樣嘛,不用一個像素一個像素表示,那要怎麼表示呢。

舉個例子,我們平常聊天的時候會發表情,而表情可以簡單分為符号表情和Emoji表情(圖像表情)。符号表情類似為₍₍◡( ╹◡╹ )◡₎₎ ,Emoji表情就不用說了吧。注意觀察符号表情,它隻是由豎線、半圓或其他幾何形狀表示。

而在圖像的表示法裡面,圖像的另外一種表示方法,也類似。

4.2 矢量圖

矢量圖是使用點、線、弧、曲線、多邊形或者其他幾何形狀和位置,來表示圖像的一種方法。實際上就是使用各種數學表達式來描述一幅圖,然後轉化成計算機語音再顯示出來。

【音視訊基礎】(四):俗稱照片的彩色數字圖像二4、圖像的種類5、灰階圖和彩色圖像6、伽馬矯正7、圖像的壓縮編碼8、圖像的檔案格式

矢量圖

就像描述一個三角形的時候,我們隻需要知道三個點,就可以得到一幅圖像。

矢量圖和位圖對比

【音視訊基礎】(四):俗稱照片的彩色數字圖像二4、圖像的種類5、灰階圖和彩色圖像6、伽馬矯正7、圖像的壓縮編碼8、圖像的檔案格式

矢量圖(左)和位圖(右)

在矢量圖表示法中,因為圖中的幾何形狀簡稱對象,都是使用數學規則來描述的,是以在顯示的時候,無論是放大還是縮小,或者移動旋轉拷貝,都是比較容易做到的。而且在放大或縮小的時候,圖像依然能夠保持清晰。

為什麼?就拿矩形來說,如果我放大了,矩形的四個點,隻是在螢幕上的坐标位置變了下,中間依然是靠線段連接配接,如左圖,圖像并不會失真。它并不會像位圖那樣,放大到最後,會看到圖像的像素塊,如右圖。

而且矢量圖在計算機存儲的時候,存儲的是數學規則,并且可以把類似的圖形做統一處理,是以在檔案大小方面較好掌控。而位圖則是把每個像素都存起來,圖像分辨率高、像素深度深的時候,占的空間會比較大。

那為什麼我們手機裡的圖像,還是位圖呢?

第一點,這是因為,真實世界裡的景象紛雜無序,很難用規則的幾何圖形去表達。

第二點,是因為,真實世界裡色彩紛雜,顔色變化陰暗透明起承轉合,如果幾何圖形再加上顔色變化,難上加難。

是以總結起來,位圖較多用來描述風景、人物,等不規則且色彩豐富的圖像。而矢量圖因為它無限放大而不失真的特性,在一些文字設計、标志設計方面應用廣泛。

5、灰階圖和彩色圖像

5.1 灰階圖

這兩種比較好了解,灰階圖就是隻有明暗像素,沒有彩色像素組成的圖像。就像我們小時候看的黑白電視。

再細分下去,當隻有黑白兩種顔色時的圖像,稱為單色圖像。這樣一來,它的每個像素的像素值,用一位(一個比特位/bit)來存儲,值為”0“或”1“,像素點非黑即白。

而一個标準的灰階圖,一個像素用一個位元組(8位)表示,這樣每個像素的值就可以為,0~255(二的八次方)之間的任意值,稱為256級灰階。當圖像的分辨率為640X480的時候,它的存儲空間為300KB(640*480/1024)。

下圖是标準單色圖和标準灰階圖的對比。

【音視訊基礎】(四):俗稱照片的彩色數字圖像二4、圖像的種類5、灰階圖和彩色圖像6、伽馬矯正7、圖像的壓縮編碼8、圖像的檔案格式

标準單色圖和标準灰階圖的對比

5.2 彩色圖像

現在看到這個詞應該很熟悉吧,說一下它的特性會更熟悉。彩色圖像的每個像素,包含了圖像的顔色資訊。

在劃分彩色圖像的時候,一般用顔色的數目來劃分。比如:

256色圖像:它是指像素的R、G、B三個值,用一個位元組來表示,這樣一個像素點可能的顔色值,就為256(二的八次方)色之一。

真彩色圖像:每個像素的R、G、B值,分别用一個位元組來表示。這樣一個像素點可能的顔色值,就為1677萬(二的二十四次方)多色之一。這裡的真彩色圖像,相對于圖像(一)中,又多了一層含義。它表示了這種圖像,達到了人眼分辨率的極限,反應了原圖的真實色彩。故稱為真彩色。當圖像的分辨率為640X480時,它的存儲空間為900KB(6404803/1024)。

6、伽馬矯正

這個詞應該很多人都聽過,即使不是專業人士,也可能早有耳聞。

在很多教材中,說之是以有伽馬矯正這個東西,是因為錄影機或手機的攝像頭,在采集自然界圖像的時候,光的攝入和錄影機電壓的轉換,并不是線性的。

而在顯示的時候,CRT發射的光的強度,和它的輸入電壓也不是線性的。

這樣就會導緻,從采集的一幅圖像,到存儲成圖像檔案,再到讀出圖像檔案,在顯示器上顯示的時候,我們看到的顯示出來的圖像,并不是最開始采集的圖像。

為了解決這個問題,就有了伽馬矯正這個東西。

它在采集和顯示圖像的時候,分别進行矯正,以達到還原原始場景的目的。

在伽馬矯正這個問題上,讨論很多,知乎上有一個高票答案,讨論關于廣義的伽馬矯正,有興趣的朋友可以看下,真的很有趣,連結如下:

https://www.zhihu.com/question/27467127

7、圖像的壓縮編碼

具體的壓縮編碼後面再講,這裡隻粗略講一下,為啥要進行壓縮編碼。

恩,如果不進行壓縮編碼,圖像會很大,完全不利于網絡傳輸。而且普通人隻能分辨二百多種顔色,多了也看不出來,是以1677萬完全浪費。

是以後來就有了JPEG壓縮編碼,注意這裡說的JPEG,是指一種圖像資料的壓縮編碼标準,并不是JPEG格式。

什麼是格式,什麼是标準

标準是指,在壓縮圖像資料的時候,該采用什麼算法、怎樣的流程去壓縮,注意目的是怎麼壓縮。

而格式是指,存放使用JPEG标準壓縮的圖像檔案格式。

8、圖像的檔案格式

自從圖像進入計算機以來,已經開發出了很多種圖像檔案存儲格式,而且互不相容。有些不相容的格式,使用起來很不友善,需要使用特定的軟體,是以有些格式也在逐漸被淘汰。

目前流行的圖像格式為:GIF、JPEG、PNG。

具體他們之間有什麼差別,又是如何産生,有何淵源,等用到的時候再寫,用不到就自動忽略了~~~