wav檔案格式分析詳解和解析代碼

轉載至:http://blog.sina.com.cn/s/blog_717f471b0100uw98.html

Wav檔案格式解析代碼，代碼見附錄，寫的過程參考了

http://www.sonicspot.com/guide/wavefiles.html

和曹京的文章，見下：

作者：曹京

日期：2006年7月17日

一、綜述

WAVE檔案作為多媒體中使用的聲波檔案格式之一，它是以RIFF格式為标準的。

RIFF是英文Resource Interchange File Format的縮寫，每個WAVE檔案的頭四個

位元組便是“RIFF”。

WAVE檔案是由若幹個Chunk組成的。按照在檔案中的出現位置包括：RIFF WAVE

Chunk, Format Chunk, Fact Chunk(可選), Data Chunk。具體見下圖：

------------------------------------------------

| RIFF WAVE Chunk |

| ID = 'RIFF' |

| RiffType = 'WAVE' |

------------------------------------------------

| Format Chunk |

| ID = 'fmt ' |

------------------------------------------------

| Fact Chunk(optional) |

| ID = 'fact' |

------------------------------------------------

| Data Chunk |

| ID = 'data' |

------------------------------------------------

圖1 Wav格式包含Chunk示例

其中除了Fact Chunk外，其他三個Chunk是必須的。每個Chunk有各自的ID，位

于Chunk最開始位置，作為标示，而且均為4個位元組。并且緊跟在ID後面的是Chunk大

小（去除ID和Size所占的位元組數後剩下的其他位元組數目），4個位元組表示，低位元組

表示數值低位，高位元組表示數值高位。下面具體介紹各個Chunk内容。

PS：

所有數值表示均為低位元組表示低位，高位元組表示高位。

二、具體介紹

RIFF WAVE Chunk

==================================

| |所占位元組數| 具體内容 |

==================================

| ID | 4 Bytes | 'RIFF' |

----------------------------------

| Size | 4 Bytes | |

----------------------------------

| Type | 4 Bytes | 'WAVE' |

----------------------------------

圖2 RIFF WAVE Chunk

以'FIFF'作為标示，然後緊跟着為size字段，該size是整個wav檔案大小減去ID

和Size所占用的位元組數，即FileLen - 8 = Size。然後是Type字段，為'WAVE'，表

示是wav檔案。

結構定義如下：

struct RIFF_HEADER

{

char szRiffID[4]; // 'R','I','F','F'

DWORD dwRiffSize;

char szRiffFormat[4]; // 'W','A','V','E'

};

Format Chunk

====================================================================

| | 位元組數 | 具體内容 |

====================================================================

| ID | 4 Bytes | 'fmt ' |

--------------------------------------------------------------------

| Size | 4 Bytes | 數值為16或18，18則最後又附加資訊 |

-------------------------------------------------------------------- ----

-------------------------------------------------------------------- |

-------------------------------------------------------------------- |

-------------------------------------------------------------------- |

-------------------------------------------------------------------- |

-------------------------------------------------------------------- |

-------------------------------------------------------------------- |

-------------------------------------------------------------------- ----

圖3 Format Chunk

以'fmt '作為标示。一般情況下Size為16，此時最後附加資訊沒有；如果為18

則最後多了2個位元組的附加資訊。主要由一些軟體制成的wav格式中含有該2個位元組的

附加資訊。

結構定義如下：

struct WAVE_FORMAT

{

WORD wFormatTag;

WORD wChannels;

DWORD dwSamplesPerSec;

DWORD dwAvgBytesPerSec;

WORD wBlockAlign;

WORD wBitsPerSample;

};

struct FMT_BLOCK

{

char szFmtID[4]; // 'f','m','t',' '

DWORD dwFmtSize;

WAVE_FORMAT wavFormat;

};

補充頭檔案樣例說明：

首先是一串“52 49 46 46”這個是Ascii字元“RIFF”，這部分是固定格式，表明這是一個WAVE檔案頭。

然後是“E4 3C 00 00”，這個是我這個WAV檔案的資料大小，記住這個大小是包括頭檔案的一部分的，包括除了前面8個位元組的所有位元組，也就等于檔案總位元組數減去8。這是一個DWORD，我這個檔案對應是15588。

然後是“57 41 56 45 66 6D 74 20”，也是Ascii字元“WAVEfmt”，這部分是固定格式。

然後是PCMWAVEFORMAT部分，可以對照一下上面的struct定義，首先就是一個WAVEFORMAT的struct。

随後是“10 00 00 00”，這是一個DWORD，對應數字16，這個對應定義中的Sizeof(PCMWAVEFORMAT)，後面我們可以看到這個段内容正好是16個位元組。

随後的位元組是“01 00”，這是一個WORD，對應定義為編碼格式“WAVE_FORMAT_PCM”，我們一般用的是這個。

随後的是“01 00”，這是一個WORD，對應數字1，表示聲道數為1，這是個單聲道Wav。

随後的是“22 56 00 00”，這是一個DWORD，對應數字22050，代表的是采樣頻率22050。

随後的是“44 AC 00 00”，這是一個DWORD，對應數字44100，代表的是每秒的資料量。

然後是“02 00”，這是一個WORD，對應數字是2，表示塊對齊的内容，含義不太清楚。

然後是“10 00”，這是一個WORD，對應WAVE檔案的采樣大小，數值為16，采樣大小為16Bits。

然後是一串“64 61 74 61”，這個是Ascii字元“data”，标示頭結束，開始資料區域。

而後是資料區的開頭，有一個DWORD，我這裡的字元是“C0 3C 00 00”，對應的十進制數為15552，看一下前面正好可以看到，檔案大小是15596，其中到“data”标志出現為止的頭是40個位元組，再減去這個标志的4個位元組正好是15552，再往後面就是真正的Wave檔案的資料體了，頭檔案的解析就到這裡。

Fact Chunk

==================================

| |所占位元組數| 具體内容 |

==================================

| ID | 4 Bytes | 'fact' |

----------------------------------

| Size | 4 Bytes | 數值為4 |

----------------------------------

| data | 4 Bytes | |

----------------------------------

圖4 Fact Chunk

Fact Chunk是可選字段，一般當wav檔案由某些軟體轉化而成，則包含該Chunk。

結構定義如下：

struct FACT_BLOCK

{

char szFactID[4]; // 'f','a','c','t'

DWORD dwFactSize;

};

Data Chunk

==================================

| |所占位元組數| 具體内容 |

==================================

| ID | 4 Bytes | 'data' |

----------------------------------

| Size | 4 Bytes | |

----------------------------------

| data | | |

----------------------------------

圖5 Data Chunk

Data Chunk是真正儲存wav資料的地方，以'data'作為該Chunk的标示。然後是

資料的大小。緊接着就是wav資料。根據Format Chunk中的聲道數以及采樣bit數，

wav資料的bit位置可以分成以下幾種形式：

---------------------------------------------------------------------

| 單聲道 | 取樣1 | 取樣2 | 取樣3 | 取樣4 |

|--------------------------------------------------------------------

| 8bit量化 | 聲道0 | 聲道0 | 聲道0 | 聲道0 |

---------------------------------------------------------------------

| 雙聲道 | 取樣1 | 取樣2 |

|--------------------------------------------------------------------

| 8bit量化 | 聲道0(左) | 聲道1(右) | 聲道0(左) | 聲道1(右) |

----------------------------------------------------------------------

| 單聲道 | 取樣1 | 取樣2 |

|---------------------------------------------------------------------

| 16bit量化 | 聲道0 | 聲道0 | 聲道0 | 聲道0 |

-----------------------------------------------------------------------

| 雙聲道 | 取樣1 | 取樣2 |

|-------------------------------------------------------------------------------

| 16bit量化 | 聲道0（左） | 聲道1（右） | 聲道0（左） | 聲道1（右）|

---------------------------------------------------------------------------------

圖6 wav資料bit位置安排方式

Data Chunk頭結構定義如下：

struct DATA_BLOCK

{

char szDataID[4]; // 'd','a','t','a'

DWORD dwDataSize;

};

三、小結

是以，根據上述結構定義以及格式介紹，很容易編寫相應的wav格式解析代碼。

這裡具體的代碼就不給出了。

代碼：

wav.h

---------------------------------------------------------------------------------------

#ifndef _WAV_H_

#define _WAV_H_

#include <stdio.h>

#include <strings.h>

#include <string.h>

#include <stdlib.h>

typedef struct _wav_riff_t{

char id[5]; //ID:"RIFF"

int size; //file_len - 8

char type[5]; //type:"WAVE"

}wav_riff_t;

typedef struct _wav_format_t{

char id[5]; //ID:"fmt"

int size;

short compression_code;

short channels;

int samples_per_sec;

int avg_bytes_per_sec;

short block_align;

short bits_per_sample;

}wav_format_t;

typedef struct _wav_fact_t{

char id[5];

int size;

}wav_fact_t;

typedef struct _wav_data_t{

char id[5];

int size;

}wav_data_t;

typedef struct _wav_t{

FILE *fp;

wav_riff_t riff;

wav_format_t format;

wav_fact_t fact;

wav_data_t data;

int file_size;

int data_offset;

int data_size;

}wav_t;

wav_t *wav_open(char *file_name);

void wav_close(wav_t **wav);

void wav_rewind(wav_t *wav);

int wav_over(wav_t *wav);

int wav_read_data(wav_t *wav, char *buffer, int buffer_size);

void wav_dump(wav_t *wav);

#endif

wav.c

---------------------------------------------------------------------------------------

#include "wav.h"

wav_t *wav_open(char *file_name){

wav_t *wav = NULL;

char buffer[256];

int read_len = 0;

int offset = 0;

if(NULL == file_name){

printf("file_name is NULL\n");

return NULL;

}

wav = (wav_t *)malloc(sizeof(wav_t));

if(NULL == wav){

printf("malloc wav failedly\n");

return NULL;

}

bzero(wav, sizeof(wav_t));

wav->fp = fopen(file_name, "r");

if(NULL == wav->fp){

printf("fopen %s failedly\n", file_name);

free(wav);

return NULL;

}

//handle RIFF WAVE chunk

read_len = fread(buffer, 1, 12, wav->fp);

if(read_len < 12){

printf("error wav file\n");

wav_close(&wav);

return NULL;

}

if(strncasecmp("RIFF", buffer, 4)){

printf("error wav file\n");

wav_close(&wav);

return NULL;

}

memcpy(wav->riff.id, buffer, 4);

wav->riff.size = *(int *)(buffer + 4);

if(strncasecmp("WAVE", buffer + 8, 4)){

printf("error wav file\n");

wav_close(&wav);

return NULL;

}

memcpy(wav->riff.type, buffer + 8, 4);

wav->file_size = wav->riff.size + 8;

offset += 12;

while(1){

char id_buffer[5] = {0};

int tmp_size = 0;

read_len = fread(buffer, 1, 8, wav->fp);

if(read_len < 8){

printf("error wav file\n");

wav_close(&wav);

return NULL;

}

memcpy(id_buffer, buffer, 4);

tmp_size = *(int *)(buffer + 4);

if(0 == strncasecmp("FMT", id_buffer, 3)){

memcpy(wav->format.id, id_buffer, 3);

wav->format.size = tmp_size;

read_len = fread(buffer, 1, tmp_size, wav->fp);

if(read_len < tmp_size){

printf("error wav file\n");

wav_close(&wav);

return NULL;

}

wav->format.compression_code = *(short *)buffer;

wav->format.channels = *(short *)(buffer + 2);

wav->format.samples_per_sec = *(int *)(buffer + 4);

wav->format.avg_bytes_per_sec = *(int *)(buffer + 8);

wav->format.block_align = *(short *)(buffer + 12);

wav->format.bits_per_sample = *(short *)(buffer + 14);

}

else if(0 == strncasecmp("DATA", id_buffer, 4)){

memcpy(wav->data.id, id_buffer, 4);

wav->data.size = tmp_size;

offset += 8;

wav->data_offset = offset;

wav->data_size = wav->data.size;

break;

}

else{

printf("unhandled chunk: %s, size: %d\n", id_buffer, tmp_size);

fseek(wav->fp, tmp_size, SEEK_CUR);

}

offset += 8 + tmp_size;

}

return wav;

}

void wav_close(wav_t **wav){

wav_t *tmp_wav;

if(NULL == wav){

return ;

}

tmp_wav = *wav;

if(NULL == tmp_wav){

return ;

}

if(NULL != tmp_wav->fp){

fclose(tmp_wav->fp);

}

free(tmp_wav);

*wav = NULL;

}

void wav_rewind(wav_t *wav){

if(fseek(wav->fp, wav->data_offset, SEEK_SET) < 0){

printf("wav rewind failedly\n");

}

int wav_over(wav_t *wav){

return feof(wav->fp);

}

int wav_read_data(wav_t *wav, char *buffer, int buffer_size){

return fread(buffer, 1, buffer_size, wav->fp);

}

void wav_dump(wav_t *wav){

printf("file length: %d\n", wav->file_size);

printf("\nRIFF WAVE Chunk\n");

printf("id: %s\n", wav->riff.id);

printf("size: %d\n", wav->riff.size);

printf("type: %s\n", wav->riff.type);

printf("\nFORMAT Chunk\n");

printf("id: %s\n", wav->format.id);

printf("size: %d\n", wav->format.size);

if(wav->format.compression_code == 0){

printf("compression: Unknown\n");

}

else if(wav->format.compression_code == 1){

printf("compression: PCM/uncompressed\n");

}

else if(wav->format.compression_code == 2){

printf("compression: Microsoft ADPCM\n");

}

else if(wav->format.compression_code == 6){

printf("compression: ITU G.711 a-law\n");

}

else if(wav->format.compression_code == 7){

printf("compression: ITU G.711 Âµ-law\n");

}

else if(wav->format.compression_code == 17){

printf("compression: IMA ADPCM\n");

}

else if(wav->format.compression_code == 20){

printf("compression: ITU G.723 ADPCM (Yamaha)\n");

}

else if(wav->format.compression_code == 49){

printf("compression: GSM 6.10\n");

}

else if(wav->format.compression_code == 64){

printf("compression: ITU G.721 ADPCM\n");

}

else if(wav->format.compression_code == 80){

printf("compression: MPEG\n");

}

else{

printf("compression: Unknown\n");

}

printf("channels: %d\n", wav->format.channels);

printf("samples: %d\n", wav->format.samples_per_sec);

printf("avg_bytes_per_sec: %d\n", wav->format.avg_bytes_per_sec);

printf("block_align: %d\n", wav->format.block_align);

printf("bits_per_sample: %d\n", wav->format.bits_per_sample);

printf("\nDATA Chunk\n");

printf("id: %s\n", wav->data.id);

printf("size: %d\n", wav->data.size);

printf("data offset: %d\n", wav->data_offset);

}

main.c

---------------------------------------------------------------------------------------

#include "wav.h"

int main(int argc, char **argv){

wav_t *wav = NULL;

if(argc != 2){

printf("Usage:\n");

printf("\twav_parse wav_file\n");

return 0;

}

wav = wav_open(argv[1]);

if(NULL != wav){

wav_dump(wav);

wav_close(&wav);

}

return 1;

}

Makefile

---------------------------------------------------------------------------------------

CC=gcc

CFLAGS=-Wall -g

EXECUTABLE=wav_parse

OBJS=wav.o main.o

default:$(EXECUTABLE)

$(EXECUTABLE):$(OBJS)

$(CC) -o $(EXECUTABLE) $(CFLAGS) $(OBJS)

%.o:%.c

$(CC) -c -o [email protected] $< $(CFLAGS)

clean:

rm -f $(EXECUTABLE)

rm -f $(OBJS)

wav檔案格式分析詳解和解析代碼

繼續閱讀

從零開始學android<Mediaplayer播放器元件（播放音頻）.四十八.>

PC端錄音上傳功能實作前言總結

音量調節實體按鍵及音頻焦點之AudioManager

音箱電路原理圖

alsa 音頻庫的移植一、ALSA的體系結構二、Linux ALSA 驅動測試三、嵌入式LINUX下 alsa庫移植.

Android深入淺出之Audio第一部分AudioTrack分析(2)Android深入淺出之Audio第一部分AudioTrack分析(2)

RK3288 -- 關于 HDMI 音頻輸出的兩種配置

Linux下音頻格式轉換指令行工具Sox音頻轉換使用Mplayer将多種格式的而檔案編碼至WAV使用FFmpeg将各種類型檔案轉換成各種類型檔案使用Lame編碼或者已不同的比特率重新編碼MP3以Ogg Vorbis格式編碼從音頻檔案中擷取資訊

海思 3536C音頻調試

ffmpeg 音量調整

AAC音頻轉PCM原始碼流

Android播放音頻之按鈕控制控制音量和播放管理音頻焦點處理音頻輸出硬體

Android 之使用MediaPlayer播放音頻

音頻學習資料整理

Python 采用ffmpeg将視訊檔案轉為音頻檔案

Android音頻相關（五）AudioManager介紹