天天看點

RGB,YUV顔色空間簡介

計算機彩色顯示器顯示色彩的原理與彩色電視機一樣,都是采用R(Red)、G(Green)、B(Blue)相加混色的原理:通過發射出三種不同強度的電子束,使螢幕内側覆寫的紅、綠、藍磷光材料發光而産生色彩。這種色彩的表示方法稱為RGB色彩空間表示(它也是多媒體計算機技術中用得最多的一種色彩空間表示方法)。

  根據三基色原理,任意一種色光F都可以用不同分量的R、G、B三色相加混合而成。

F = r [ R ] + g [ G ] + b [ B ]

  其中,r、g、b分别為三基色參與混合的系數。當三基色分量都為0(最弱)時混合為黑色光;而當三基色分量都為k(最強)時混合為白色光。調整r、g、b三個系數的值,可以混合出介于黑色光和白色光之間的各種各樣的色光。

  那麼YUV又從何而來呢?在現代彩色電視系統中,通常采用三管彩色錄影機或彩色CCD錄影機進行攝像,然後把攝得的彩色圖像信号經分色、分别放大校正後得到RGB,再經過矩陣變換電路得到亮度信号Y和兩個色差信号R-Y(即U)、B-Y(即V),最後發送端将亮度和色差三個信号分别進行編碼,用同一信道發送出去。這種色彩的表示方法就是所謂的YUV色彩空間表示。

  采用YUV色彩空間的重要性是它的亮度信号Y和色度信号U、V是分離的。如果隻有Y信号分量而沒有U、V分量,那麼這樣表示的圖像就是黑白灰階圖像。彩色電視采用YUV空間正是為了用亮度信号Y解決彩色電視機與黑白電視機的相容問題,使黑白電視機也能接收彩色電視信号。

 YUV與RGB互相轉換的公式(RGB取值範圍均為0-255): Y = 0.299R + 0.587G + 0.114B U = -0.147R - 0.289G + 0.436B V = 0.615R - 0.515G - 0.100B

R = Y + 1.14V G = Y - 0.39U - 0.58V B = Y + 2.03U

常見的RGB和YUV格式: 常見的RGB格式有RGB1、RGB4、RGB8、RGB565、RGB555、RGB24、RGB32、ARGB32等;

常見的YUV格式有YUY2、YUYV、YVYU、UYVY、AYUV、Y41P、Y411、Y211、IF09、IYUV、YV12、YVU9、YUV411、YUV420等。

      GUID                                         格式描述 MEDIASUBTYPE_RGB1    2色,每個像素用1位表示,需要調色闆 MEDIASUBTYPE_RGB4    16色,每個像素用4位表示,需要調色闆 MEDIASUBTYPE_RGB8    256色,每個像素用8位表示,需要調色闆 MEDIASUBTYPE_RGB565    每個像素用16位表示,RGB分量分别使用5位、6位、5位 MEDIASUBTYPE_RGB555    每個像素用16位表示,RGB分量都使用5位(剩下的1位不用) MEDIASUBTYPE_RGB24    每個像素用24位表示,RGB分量各使用8位 MEDIASUBTYPE_RGB32    每個像素用32位表示,RGB分量各使用8位(剩下的8位不用) MEDIASUBTYPE_ARGB32    每個像素用32位表示,RGB分量各使用8位(剩下的8位用于表示Alpha通道值)

打包格式YUV MEDIASUBTYPE_YUY2    YUY2格式,以4:2:2方式打包 MEDIASUBTYPE_YUYV    YUYV格式(實際格式與YUY2相同) MEDIASUBTYPE_YVYU    YVYU格式,以4:2:2方式打包 MEDIASUBTYPE_UYVY    UYVY格式,以4:2:2方式打包 MEDIASUBTYPE_AYUV    帶Alpha通道的4:4:4 YUV格式 MEDIASUBTYPE_Y41P    Y41P格式,以4:1:1方式打包 MEDIASUBTYPE_Y411    Y411格式(實際格式與Y41P相同) MEDIASUBTYPE_Y211    Y211格式

平面格式YUV MEDIASUBTYPE_IF09    IF09格式 MEDIASUBTYPE_IYUV    IYUV格式 MEDIASUBTYPE_YV12    YV12格式 MEDIASUBTYPE_YVU9    YVU9格式

下面分别介紹上述各種RGB格式:

        RGB1、RGB4、RGB8都是調色闆類型的RGB格式,在描述這些媒體類型的格式細節時,通常會在BITMAPINFOHEADER資料結構後面跟着一個調色闆(定義一系列顔色)。它們的圖像資料并不是真正的顔色值,而是目前像素顔色值在調色闆中的索引。以RGB1(2色位圖)為例,比如它的調色闆中定義的兩種顔色值依次為0x000000(黑色)和0xFFFFFF(白色),那麼圖像資料001101010111…(每個像素用1位表示)表示對應各像素的顔色為:黑黑白白黑白黑白黑白白白…。

        RGB565使用16位表示一個像素,這16位中的5位用于R,6位用于G,5位用于B。程式中通常使用一個字(WORD,一個字等于兩個位元組)來操作一個像素。當讀出一個像素後,這個字的各個位意義如下:      高位元組              低位元組 R R R R R G G G     G G G B B B B B 可以組合使用屏蔽字和移位操作來得到RGB各分量的值:

#define RGB565_MASK_RED    0xF800 #define RGB565_MASK_GREEN  0x07E0 #define RGB565_MASK_BLUE   0x001F R = (wPixel & RGB565_MASK_RED) >> 11;   // 取值範圍0-31 G = (wPixel & RGB565_MASK_GREEN) >> 5;  // 取值範圍0-63 B =  wPixel & RGB565_MASK_BLUE;         // 取值範圍0-31

        RGB555是另一種16位的RGB格式,RGB分量都用5位表示(剩下的1位不用)。使用一個字讀出一個像素後,這個字的各個位意義如下:      高位元組             低位元組 X R R R R G G       G G G B B B B B       (X表示不用,可以忽略) 可以組合使用屏蔽字和移位操作來得到RGB各分量的值:

#define RGB555_MASK_RED    0x7C00 #define RGB555_MASK_GREEN  0x03E0 #define RGB555_MASK_BLUE   0x001F R = (wPixel & RGB555_MASK_RED) >> 10;   // 取值範圍0-31 G = (wPixel & RGB555_MASK_GREEN) >> 5;  // 取值範圍0-31 B =  wPixel & RGB555_MASK_BLUE;         // 取值範圍0-31

        RGB24使用24位來表示一個像素,RGB分量都用8位表示,取值範圍為0-255。注意在記憶體中RGB各分量的排列順序為:BGR BGR BGR…。通常可以使用RGBTRIPLE資料結構來操作一個像素,它的定義為:

typedef struct tagRGBTRIPLE {    BYTE rgbtBlue;    // 藍色分量   BYTE rgbtGreen;   // 綠色分量   BYTE rgbtRed;     // 紅色分量 } RGBTRIPLE;

        RGB32使用32位來表示一個像素,RGB分量各用去8位,剩下的8位用作Alpha通道或者不用。(ARGB32就是帶Alpha通道的RGB32。)注意在記憶體中RGB各分量的排列順序為:BGRA BGRA BGRA…。通常可以使用RGBQUAD資料結構來操作一個像素,它的定義為:

typedef struct tagRGBQUAD {   BYTE    rgbBlue;      // 藍色分量   BYTE    rgbGreen;     // 綠色分量   BYTE    rgbRed;       // 紅色分量   BYTE    rgbReserved;  // 保留位元組(用作Alpha通道或忽略) } RGBQUAD;

下面介紹各種YUV格式:

“Y”表示明亮度(Luminance或Luma),也就是灰階值;“亮度”是透過RGB輸入信号來建立的,方法是将RGB信号的特定部分疊加到一起。

“U”和“V” 表示的則是色度(Chrominance或Chroma),作用是描述影像色彩及飽和度,用于指定像素的顔色。“色度”則定義了顔色的兩個方面─色調與飽和度,分别用Cr和CB來表示。其中,Cr反映了GB輸入信号紅色部分與RGB信号亮度值之間的差異。而CB反映的是RGB輸入信号藍色部分與RGB信号亮度值之同的差異。

主要的采樣格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。

其中YCbCr 4:1:1 比較常用,其含義為:每個點儲存一個 8bit 的亮度值(也就是Y值),每 2x2 個點儲存一個 Cr 和Cb 值, 圖像在肉眼中的感覺不會起太大的變化。是以, 原來用 RGB(R,G,B 都是 8bit unsigned) 模型, 1個點需要 8x3=24 bites,(全采樣後,YUV仍各占8bit)。按4:1:1采樣後,而現在平均僅需要 8+(8/4)+(8/4)=12bites(4個點,8*4(Y)+8(U)+8(V)=48bit), 平均每個點占12bites。這樣就把圖像的資料壓縮了一半。

 上邊僅給出了理論上的示例,在實際資料存儲中是有可能是不同的,下面給出幾種具體的存儲形式:

  (1) YUV 4:4:4

  YUV三個信道的抽樣率相同,是以在生成的圖像裡,每個象素的三個分量資訊完整(每個分量通常8比特),經過8比特量化之後,未經壓縮的每個像素占用3個位元組。

  下面的四個像素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  存放的碼流為: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3

  (2) YUV 4:2:2

  每個色差信道的抽樣率是亮度信道的一半,是以水準方向的色度抽樣率隻是4:4:4的一半。對非壓縮的8比特量化的圖像來說,每個由兩個水準方向相鄰的像素組成的宏像素需要占用4位元組記憶體。

  下面的四個像素為:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  存放的碼流為:Y0 U0 Y1 V1 Y2 U2 Y3 V3

  映射出像素點為:[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]

  (3) YUV 4:1:1

  4:1:1的色度抽樣,是在水準方向上對色度進行4:1抽樣。對于低端使用者和消費類産品這仍然是可以接受的。對非壓縮的8比特量化的視訊來說,每個由4個水準方向相鄰的像素組成的宏像素需要占用6位元組記憶體。

  下面的四個像素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  存放的碼流為: Y0 U0 Y1 Y2 V2 Y3

  映射出像素點為:[Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]

  (4)YUV4:2:0

  4:2:0并不意味着隻有Y,Cb而沒有Cr分量。它指得是對每行掃描線來說,隻有一種色度分量以2:1的抽樣率存儲。相鄰的掃描行存儲不同的色度分量,也就是說,如果一行是4:2:0的話,下一行就是4:0:2,再下一行是4:2:0...以此類推。對每個色度分量來說,水準方向和豎直方向的抽樣率都是2:1,是以可以說色度的抽樣率是4:1。對非壓縮的8比特量化的視訊來說,每個由2x2個2行2列相鄰的像素組成的宏像素需要占用6位元組記憶體。

  下面八個像素為:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  [Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]

  存放的碼流為:Y0 U0 Y1 Y2 U2 Y3

  Y5 V5 Y6 Y7 V7 Y8

  映射出的像素點為:[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]

  [Y5 U0 V5] [Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]

YUV格式通常有兩大類:打包(packed)格式和平面(planar)格式。

前者将YUV分量存放在同一個數組中,通常是幾個相鄰的像素組成一個宏像素(macro-pixel);

而後者使用三個數組分開存放YUV三個分量,就像是一個三維平面一樣。

表2.3中的YUY2到Y211都是打包格式,而IF09到YVU9都是平面格式。(注意:在介紹各種具體格式時,YUV各分量都會帶有下标,如Y0、U0、V0表示第一個像素的YUV分量,Y1、U1、V1表示第二個像素的YUV分量,以此類推。)

¨ YUY2(和YUYV)格式為每個像素保留Y分量,而UV分量在水準方向上每兩個像素采樣一次。一個宏像素為4個位元組,實際表示2個像素。(4:2:2的意思為一個宏像素中有4個Y分量、2個U分量和2個V分量。)圖像資料中YUV分量排列順序如下:

  Y0 U0 Y1 V0 Y2 U2 Y3 V2 …

  ¨ YVYU格式跟YUY2類似,隻是圖像資料中YUV分量的排列順序有所不同:

  Y0 V0 Y1 U0 Y2 V2 Y3 U2 …

  ¨ UYVY格式跟YUY2類似,隻是圖像資料中YUV分量的排列順序有所不同:

  U0 Y0 V0 Y1 U2 Y2 V2 Y3 …

  ¨ AYUV格式帶有一個Alpha通道,并且為每個像素都提取YUV分量,圖像資料格式如下:

  A0 Y0 U0 V0 A1 Y1 U1 V1 …

  ¨ Y41P(和Y411)格式為每個像素保留Y分量,而UV分量在水準方向上每4個像素采樣一次。一個宏像素為12個位元組,實際表示8個像素。圖像資料中YUV分量排列順序如下:

  U0 Y0 V0 Y1 U4 Y2 V4 Y3 Y4 Y5 Y6 Y8 …

  ¨ Y211格式在水準方向上Y分量每2個像素采樣一次,而UV分量每4個像素采樣一次。一個宏像素為4個位元組,實際表示4個像素。圖像資料中YUV分量排列順序如下:

  Y0 U0 Y2 V0 Y4 U4 Y6 V4 …

  ¨ YVU9格式為每個像素都提取Y分量,而在UV分量的提取時,首先将圖像分成若幹個4 x 4的宏塊,然後每個宏塊提取一個U分量和一個V分量。圖像資料存儲時,首先是整幅圖像的Y分量數組,然後就跟着U分量數組,以及V分量數組。IF09格式與YVU9類似。

  ¨ IYUV格式為每個像素都提取Y分量,而在UV分量的提取時,首先将圖像分成若幹個2 x 2的宏塊,然後每個宏塊提取一個U分量和一個V分量。YV12格式與IYUV類似。

  ¨ YUV411、YUV420格式多見于DV資料中,前者用于NTSC制,後者用于PAL制。YUV411為每個像素都提取Y分量,而UV分量在水準方向上每4個像素采樣一次。YUV420并非V分量采樣為0,而是跟YUV411相比,在水準方向上提高一倍色差采樣頻率,在垂直方向上以U/V間隔的方式減小一半色差采樣,如上圖所示。

繼續閱讀