本來是應該先寫一個媒體檔案格式的簡單講解的,還沒來得及寫,以後再寫。今天就先根據ffmpeg的flv.c的flv_demux這個結構體來講解一下目前比較流行的媒體格式flv.
FLV 是FLASH VIDEO的簡稱,FLV流媒體格式是随着Flash MX的推出發展而來的視訊格式。由于它形成的檔案極小、加載速度極快,使得網絡觀看視訊檔案成為可能.目前主流的媒體網站像國内的優酷、國外youtube其标清格式的檔案均采用flv的格式。
FLV是一個二進制檔案,其檔案格式如下圖 ,由檔案頭(FLV header)和很多tag組成。tag又可以分成三類:audio,video,script,分别代表音頻流,視訊流,腳本流(關鍵字或者檔案資訊之類)。
<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/20110811215722515.jpg"></a>
FLV的Header資訊一般比較簡單,包括檔案類型之類的全局資訊。如下圖中解析:
檔案類型3bytes 總是FLV(0x46 0x4C 0x56),否則就不是在ffmpeg中在沒有指定檔案格式的情況下,也是通過這個字段來探測檔案是否屬于FLV格式的。
版本1byte 一般是0x01,表示FLV version 1
流資訊1byte 倒數第一bit是1表示有視訊,倒數第三bit是1表示有音頻,其他都應該是0(有些軟體如flvtool2可能造成倒數第四bit是1,不過也沒發現有什麼不對)
header長度4bytes 整個檔案頭的長度,一般是9(3+1+1+4),當然頭部字段也有可能包含其它資訊這個時間其長度就不是9了。
FLV body就是由很多tag組成的,一個tag包括下列資訊:
previoustagsize 4bytes 前一個tag的長度,第一個tag就是0
tag類型1byte 共分為三類:
* 8 -- 音頻tag
* 9 -- 視訊tag
* 18 -- 腳本tag
streamsID 3bytes 總是0(不知道幹啥用)
資料區:根據不同的tag類型就有不同的資料區
腳本tag一般是用文本方式表示,如下圖flv的metadata資訊:
<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/201108112157364569.jpg"></a>
從中可以看出是通過文本的方式來标記的,其解析後其header資訊為:
<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/201108112157509005.jpg"></a>
從中可以看出其type為18。time stamp為0.data size為33638.
metadata tag data資訊解析後為:
<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/201108112157571833.jpg"></a>
其中有一些媒體資訊:
例如視訊的:高和寬它的codec id。幀率。音頻的資訊例如:音頻的sample rate,codec id,sample size及是否立體聲。還有整個檔案的大小等等。
音頻的tag資訊如下圖:
<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/201108112158049994.jpg"></a>
其中time stamp 為0是因為其為第一個音頻tag.
<a href="http://images.cnblogs.com/cnblogs_com/qingquan/201108/201108112158066416.jpg"></a>
這是檔案中的第6個tag是以其time stamp不為0。因為其為視訊tag是以其type為9。
其中flv_read_header主要是從檔案中讀取一些頭資訊,同時作一些初始化化的工作
static int flv_read_header(AVFormatContext *s,AVFormatParameters *ap)
{
……
url_fskip(s->pb, 4); //将flv的頭去掉。
flags = get_byte(s->pb);//讀出flv的video和audio flag資訊。
……
if(flags & FLV_HEADER_FLAG_HASVIDEO){
if(!create_stream(s, 0)) //建立視訊流
return AVERROR(ENOMEM);
}
if(flags & FLV_HEADER_FLAG_HASAUDIO){
if(!create_stream(s, 1)) //建立音頻流
}
offset = get_be32(s->pb); //擷取檔案頭長度
……
}
其它tag的讀取:
static int flv_read_packet(AVFormatContext *s, AVPacket *pkt)
……
for(;;url_fskip(s->pb, 4)){ /* pkt size is repeated at end. skip it */
pos = url_ftell(s->pb);
type = get_byte(s->pb); //擷取tag的類型,前面已經提到flv的tag大概有以下三種 :FLV_TAG_TYPE_AUDIO = 0x08,FLV_TAG_TYPE_VIDEO = 0x09,FLV_TAG_TYPE_META = 0x12,
size = get_be24(s->pb);//擷取tag的長度
dts = get_be24(s->pb);
dts |= get_byte(s->pb) << 24; //計算tag的timestamp也就是dts資訊
……
if (type == FLV_TAG_TYPE_AUDIO) { //判斷是否為audio tag
……
} else if (type == FLV_TAG_TYPE_VIDEO) {//判斷是否為video tag
if ((flags & 0xf0) == 0x50) /* video info / command frame */
goto skip;
} else {
if (type == FLV_TAG_TYPE_META && size > 13+1+4)//判斷是否為meta tag,如果是meta資訊則會将資訊存放在一個map表中。