H264關于一幀完整幀被分切成多個Slice時的合并思路

2023-08-03 23:17:43

在對H264進行編解碼分析時，碰到一個完整視訊幀被切分成多個Slice用于網絡媒體傳輸的情況。而且接收端進行解碼時需要一個完整幀(FFmpeg解碼不需要拼接，内部已實作)，是以怎麼拼接多個Slice呢？

對于H264視訊流中關于NAL Unit句法、Slice Header結構等不是本文講述的重點，相關資料可在網上查詢，但需要對H264流媒體協定格式中的AVCC及Annex B格式有一定了解。本文主要以Annex B視訊格式協定講解。

Annnex B格式在接收端接收到視訊幀資料基本以0x000001或0x00000001開始，一般完整I幀包含：SPS、PPS、SEI、I幀資料(也有可能不包含SPS、PPS等資訊)，如下圖：

H264關于一幀完整幀被分切成多個Slice時的合并思路

P幀資料如下圖：

H264關于一幀完整幀被分切成多個Slice時的合并思路

若完整的視訊幀未被切分成多個slice時，可直接被解碼成YUV或RGB資料，但是當切分成多個slice，需要根據first_mb_in_slice計算每個幀片所在位置。

比如上圖B幀中資料為0x00 0x00 0x00 0x01 0x41 0xE2，讀取第6位轉成二進制：1110 0010，與上0x80：0xB8&0x80=0x80,即表示為一幀的第一片(可查詢指數哥倫布碼，即第一個位為1)。接下來一包資料為0x00 0x00 0x00 0x01 0x41 0x63，則與上0x80為0x0，則表示不是第一片(不是第一個片時的值在上一包的基礎上會出現遞增)。可歸納規律（假設的資料）：

第一包：0x00 0x00 0x00 0x01 0x41 0xE1

第二包：0x00 0x00 0x00 0x01 0x41 0x62

第三包：0x00 0x00 0x00 0x01 0x41 0x63

第四包：0x00 0x00 0x00 0x01 0x41 0xE2

可看出第一包0xE1&0x80=0x80則是第一片，0x62&0x80=0x0則為第二包，直到遇到下一個0x80時為完整的一幀(第一包+第二包+第三包)。

以上就是合并的基本思路，一般情況下I幀不會被切分成多個slice，而是以完整幀進行傳輸，P幀多數情況下存在切分的情況。

H264關于一幀完整幀被分切成多個Slice時的合并思路

繼續閱讀

WebRTC 音頻抗弱網技術（上）前向糾錯技術後向糾錯技術編碼器 OPUS 抗弱網特性[7]

vue 實作表格合并

python+vlc 實作視訊播放，需要安裝這個vlc這個子產品,使用pip install vlc安裝，出現無法找到子產品錯誤解決方法

編譯libav(ffmpeg)庫

.slice()取指定位置的值

【轉載】svn的merge使用例子

【音視訊】直播CDN介紹

軟體錄制電腦揚聲器音頻的原理

流暢看1080p、2k、4k視訊需要多大帶寬？

FFmpeg 解碼視訊流實作yuv播放

ae輸出音頻為mp4

【投影儀】投影儀相關知識及參數科普

壓縮編碼M-JPEG、MPEG4、H.264

二、主流視訊編碼标準的發展：H.261\H.263\MPEG-1\MPEG-2\MPEG-4一、發展曆程：二、H.261标準三、H.263标準四、MPEG-1标準五、MPEG-2标準六、MPEG-4标準

V4L2視訊采集與H264編碼1—V4L2采集JPEG資料

音視訊基礎1：H264、H265、MPEG-4、VP8、VP9編碼基礎知識個人認知，程式員職業發展出路編碼器發展史編碼原理H264H265