天天看點

MPEG-2 數字視訊技術參考指南 (4)—— MPEG-2音頻壓縮

轉載請注明出處: http://blog.csdn.net/zhubin215130/article/details/8938098

        MPEG-2音頻壓縮充分利用了人耳的限制,在更嘈雜的背景音中難以聽出相似的目标聲音。有兩種類型的掩蔽:聽覺掩蔽和時域掩蔽。

  • 聽覺掩蔽

        聽覺掩蔽發生在兩個相似頻率聲音同時出現的時候,如果一個聲音比另一個的音量更大,它将完全淹沒另一個聲音。比如說,當你想在火車站小聲談話的時候,聽覺掩蔽就發生了,穿行而過的火車會完全淹沒掉你的聲音。當火車的聲音出現後,較為輕微的聲音将無法被感覺到。

        兩個信号在頻率上越接近,就越容易發生聽覺掩蔽,盡管可能其中一個聲音的音量隻是稍微大那麼一點點。比如說,如果兩個小号發出非常近似的高頻聲,音量較弱一點的小号将無法被聽到。但是,如果換成是一個低音鼓用相同分貝演奏,弱音量的小号則很容易被聽見,因為兩者的聲音頻率有顯著的不同。由于人耳的靈敏度依賴于頻率,是以掩蔽效果也就依賴于頻率。相比高頻音而言,低頻音之間需要離得更近才能被掩蔽,一般來說,弱純音離強純音越近(頻率相近)就越容易被掩蔽。

  • 時域掩蔽

        當一個高分貝的聲音出現後,它将淹沒掉緊跟其之前或之後的低分貝的聲音,這種現象稱之為時域掩蔽。通常時域掩蔽的時間範圍是在高分貝聲音之前或之後的幾毫秒,火車汽笛的轟鳴很容易掩蔽掉緊跟其後的微弱的哔哔聲。

        為了充分利用這些聽覺特性,音頻壓縮算法将音頻頻譜劃分成許多次頻帶(sub-band)。每個次頻帶的動态範圍會單獨的縮減,是以動态範圍壓縮的效果就不是很顯著。這意味着可能每個采樣隻有2-4bit,而不是每個次頻帶中的音頻采樣都是16bit。次頻帶中也使用度量常數,每個次頻帶的bit配置設定也是獨立開的,是以重要的頻段區間具有更高的權重。次頻帶的大小會根據頻率的不同而不同,以适應人耳的頻率掩蔽。

繼續閱讀