音頻處理流程
直播用戶端的處理流程
音頻資料流
人類聽覺範圍
20Hz~20000Hz Hz:1秒鐘振動的次數
聲音三要素
音調:音頻的快慢(聲音的頻率) 兒童>女生>男生
音量:振動的幅度
音色:諧波
音頻原始資料格式
PCM WAV
量化基本概念
采樣大小:一個采樣用多少bit存放,常用的是16位。
采用頻率:8k,16k,32k,44.1k,48k。
聲道數:單聲道,雙聲道,多聲道。
碼率計算
一個PCM音頻流的碼率為采樣率,采樣大小和聲道數的乘積。
例如:采樣率為44.1kHz,采樣大小為16bit,雙聲道的PCM編碼的WAV檔案,它的碼率為:44.1k×16×2=1411.2kb/s,這麼大的碼流顯然無法在網絡上傳輸。