天天看點

媒體格式分析之flv -- 基于FFMPEG

本來是應該先寫一個媒體檔案格式的簡單講解的,還沒來得及寫,以後再寫。今天就先根據ffmpeg的flv.c的flv_demux這個結構體來講解一下目前比較流行的媒體格式flv.

FLV 是FLASH VIDEO的簡稱,FLV流媒體格式是随着Flash MX的推出發展而來的視訊格式。由于它形成的檔案極小、加載速度極快,使得網絡觀看視訊檔案成為可能.目前主流的媒體網站像國内的優酷、國外youtube其标清格式的檔案均采用flv的格式。

FLV是一個二進制檔案,其檔案格式如下圖 ,由檔案頭(FLV header)和很多tag組成。tag又可以分成三類:audio,video,script,分别代表音頻流,視訊流,腳本流(關鍵字或者檔案資訊之類)。

<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/20110811215722515.jpg"></a>

FLV的Header資訊一般比較簡單,包括檔案類型之類的全局資訊。如下圖中解析:

檔案類型3bytes 總是FLV(0x46 0x4C 0x56),否則就不是在ffmpeg中在沒有指定檔案格式的情況下,也是通過這個字段來探測檔案是否屬于FLV格式的。

版本1byte 一般是0x01,表示FLV version 1

流資訊1byte 倒數第一bit是1表示有視訊,倒數第三bit是1表示有音頻,其他都應該是0(有些軟體如flvtool2可能造成倒數第四bit是1,不過也沒發現有什麼不對)

header長度4bytes 整個檔案頭的長度,一般是9(3+1+1+4),當然頭部字段也有可能包含其它資訊這個時間其長度就不是9了。

FLV body就是由很多tag組成的,一個tag包括下列資訊:

      previoustagsize 4bytes 前一個tag的長度,第一個tag就是0

tag類型1byte 共分為三類:

* 8 -- 音頻tag

* 9 -- 視訊tag

* 18 -- 腳本tag

streamsID 3bytes 總是0(不知道幹啥用)

資料區:根據不同的tag類型就有不同的資料區

腳本tag一般是用文本方式表示,如下圖flv的metadata資訊:

<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/201108112157364569.jpg"></a>

從中可以看出是通過文本的方式來标記的,其解析後其header資訊為:

<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/201108112157509005.jpg"></a>

從中可以看出其type為18。time stamp為0.data size為33638.

metadata tag data資訊解析後為:

<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/201108112157571833.jpg"></a>

其中有一些媒體資訊:

例如視訊的:高和寬它的codec id。幀率。音頻的資訊例如:音頻的sample rate,codec id,sample size及是否立體聲。還有整個檔案的大小等等。

音頻的tag資訊如下圖:

<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/201108112158049994.jpg"></a>

其中time stamp 為0是因為其為第一個音頻tag.

<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/201108112158066416.jpg"></a>

這是檔案中的第6個tag是以其time stamp不為0。因為其為視訊tag是以其type為9。

其中flv_read_header主要是從檔案中讀取一些頭資訊,同時作一些初始化化的工作

static int flv_read_header(AVFormatContext *s,AVFormatParameters *ap) 

{

         ……

    url_fskip(s-&gt;pb, 4); //将flv的頭去掉。 

    flags = get_byte(s-&gt;pb);//讀出flv的video和audio flag資訊。

         ……  

        if(flags &amp; FLV_HEADER_FLAG_HASVIDEO){ 

        if(!create_stream(s, 0))  //建立視訊流 

            return AVERROR(ENOMEM); 

    } 

    if(flags &amp; FLV_HEADER_FLAG_HASAUDIO){ 

        if(!create_stream(s, 1)) //建立音頻流 

    }

    offset = get_be32(s-&gt;pb); //擷取檔案頭長度

        …… 

}

其它tag的讀取:

static int flv_read_packet(AVFormatContext *s, AVPacket *pkt) 

     …… 

for(;;url_fskip(s-&gt;pb, 4)){ /* pkt size is repeated at end. skip it */ 

    pos = url_ftell(s-&gt;pb); 

    type = get_byte(s-&gt;pb); //擷取tag的類型,前面已經提到flv的tag大概有以下三種 :FLV_TAG_TYPE_AUDIO = 0x08,FLV_TAG_TYPE_VIDEO = 0x09,FLV_TAG_TYPE_META  = 0x12, 

    size = get_be24(s-&gt;pb);//擷取tag的長度 

    dts = get_be24(s-&gt;pb); 

    dts |= get_byte(s-&gt;pb) &lt;&lt; 24; //計算tag的timestamp也就是dts資訊

    …… 

    if (type == FLV_TAG_TYPE_AUDIO) { //判斷是否為audio tag

       …… 

         } else if (type == FLV_TAG_TYPE_VIDEO) {//判斷是否為video tag

               if ((flags &amp; 0xf0) == 0x50) /* video info / command frame */ 

            goto skip; 

    } else { 

        if (type == FLV_TAG_TYPE_META &amp;&amp; size &gt; 13+1+4)//判斷是否為meta tag,如果是meta資訊則會将資訊存放在一個map表中。 

繼續閱讀