天天看點

H.264 RTP payload 格式

H.264 視訊 RTP 負載格式

1. 網絡抽象層單元類型 (NALU)

NALU 頭由一個位元組組成, 它的文法如下:

      +---------------+

      |0|1|2|3|4|5|6|7|

      +-+-+-+-+-+-+-+-+

      |F|NRI|  Type   |

F: 1 個比特.

  forbidden_zero_bit. 在 H.264 規範中規定了這一位必須為 0.

NRI: 2 個比特.

  nal_ref_idc. 取 00 ~ 11, 似乎訓示這個 NALU 的重要性, 如 00 的 NALU ×××可以丢棄它而不影響圖像的回放. 不過一般情況下不太關心

這個屬性.

Type: 5 個比特.

  nal_unit_type. 這個 NALU 單元的類型. 簡述如下:

  0     沒有定義

  1-23  NAL單元  單個 NAL 單元包.

  24    STAP-A   單一時間的組合包

  25    STAP-B   單一時間的組合包

  26    MTAP16   多個時間的組合包

  27    MTAP24   多個時間的組合包

  28    FU-A     分片的單元

  29    FU-B     分片的單元

  30-31 沒有定義

2. 打包模式

  下面是 RFC 3550 中規定的 RTP 頭的結構.

       0                   1                   2                   3

       0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1

      +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

      |V=2|P|X|  CC   |M|     PT      |       sequence number         |

      |                           timestamp                           |

      |           synchronization source (×××C) identifier            |

      +=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+

      |            contributing source (CSRC) identifiers             |

      |                             ....                              |

  負載類型 Payload type (PT): 7 bits

  序列号 Sequence number (SN): 16 bits

  時間戳 Timestamp: 32 bits

  H.264 Payload 格式定義了三種不同的基本的負載(Payload)結構. 接收端可能通過 RTP Payload

  的第一個位元組來識别它們. 這一個位元組類似 NALU 頭的格式, 而這個頭結構的 NAL 單元類型字段

  則指出了代表的是哪一種結構,

  這個位元組的結構如下, 可以看出它和 H.264 的 NALU 頭結構是一樣的.

  字段 Type: 這個 RTP payload 中 NAL 單元的類型. 這個字段和 H.264 中類型字段的差別是, 當 type

  的值為 24 ~ 31 表示這是一個特别格式的 NAL 單元, 而 H.264 中, 隻取 1~23 是有效的值.

  可能的結構類型分别有:

  1. 單一 NAL 單元模式

     即一個 RTP 包僅由一個完整的 NALU 組成. 這種情況下 RTP NAL 頭類型字段和原始的 H.264的

  NALU 頭類型字段是一樣的.

  2. 組合封包模式

    即可能是由多個 NAL 單元組成一個 RTP 包. 分别有4種組合方式: STAP-A, STAP-B, MTAP16, MTAP24.

  那麼這裡的類型值分别是 24, 25, 26 以及 27.

  3. 分片封包模式

    用于把一個 NALU 單元封裝成多個 RTP 包. 存在兩種類型 FU-A 和 FU-B. 類型值分别是 28 和 29.

2.1 單一 NAL 單元模式

  對于 NALU 的長度小于 MTU 大小的包, 一般采用單一 NAL 單元模式.

  對于一個原始的 H.264 NALU 單元常由 [Start Code] [NALU Header] [NALU Payload] 三部分組成, 其中 Start Code 用于标示這是一個

NALU 單元的開始, 必須是 "00 00 00 01" 或 "00 00 01", NALU 頭僅一個位元組, 其後都是 NALU 單元内容.

  打包時去除 "00 00 01" 或 "00 00 00 01" 的開始碼, 把其他資料封包的 RTP 包即可.

      |F|NRI|  type   |                                               |

      +-+-+-+-+-+-+-+-+                                               |

      |                                                               |

      |               Bytes 2..n of a Single NAL unit                 |

      |                               +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

      |                               :...OPTIONAL RTP padding        |

  如有一個 H.264 的 NALU 是這樣的:

  [00 00 00 01 67 42 A0 1E 23 56 0E 2F ... ]

  這是一個序列參數集 NAL 單元. [00 00 00 01] 是四個位元組的開始碼, 67 是 NALU 頭, 42 開始的資料是 NALU 内容.

  封裝成 RTP 包将如下:

  [ RTP Header ] [ 67 42 A0 1E 23 56 0E 2F ]

  即隻要去掉 4 個位元組的開始碼就可以了.

2.2 組合封包模式

  其次, 當 NALU 的長度特别小時, 可以把幾個 NALU 單元封在一個 RTP 包中.

      |                          RTP Header                           |

      |STAP-A NAL HDR |         NALU 1 Size           | NALU 1 HDR    |

      |                         NALU 1 Data                           |

      :                                                               :

      +               +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

      |               | NALU 2 Size                   | NALU 2 HDR    |

      |                         NALU 2 Data                           |

2.3 Fragmentation Units (FUs).

  而當 NALU 的長度超過 MTU 時, 就必須對 NALU 單元進行分片封包. 也稱為 Fragmentation Units (FUs).

      | FU indicator  |   FU header   |                               |

      +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+                               |

      |                         FU payload                            |

      Figure 14.  RTP payload format for FU-A

   The FU indicator octet has the following format:

   The FU header has the following format:

      |S|E|R|  Type   |

3. SDP 參數

  下面描述了如何在 SDP 中表示一個 H.264 流:

  . "m=" 行中的媒體名必須是 "video"

  . "a=rtpmap" 行中的編碼名稱必須是 "H264".

  . "a=rtpmap" 行中的時鐘頻率必須是 90000.

  . 其他參數都包括在 "a=fmtp" 行中.

  如:

  m=video 49170 RTP/AVP 98

  a=rtpmap:98 H264/90000

  a=fmtp:98 profile-level-id=42A01E; sprop-parameter-sets=Z0IACpZTBYmI,aMljiA==

  下面介紹一些常用的參數.

3.1 packetization-mode:

  表示支援的封包模式.

  當 packetization-mode 的值為 0 時或不存在時, 必須使用單一 NALU 單元模式.

  當 packetization-mode 的值為 1 時必須使用非交錯(non-interleaved)封包模式.

  當 packetization-mode 的值為 2 時必須使用交錯(interleaved)封包模式.

  這個參數不可以取其他的值.

繼續閱讀