MPEG-2 數字視訊技術參考指南（4）—— MPEG-2音頻壓縮

2023-06-30 06:48:15

轉載請注明出處： http://blog.csdn.net/zhubin215130/article/details/8938098

MPEG-2音頻壓縮充分利用了人耳的限制，在更嘈雜的背景音中難以聽出相似的目标聲音。有兩種類型的掩蔽：聽覺掩蔽和時域掩蔽。

聽覺掩蔽

聽覺掩蔽發生在兩個相似頻率聲音同時出現的時候，如果一個聲音比另一個的音量更大，它将完全淹沒另一個聲音。比如說，當你想在火車站小聲談話的時候，聽覺掩蔽就發生了，穿行而過的火車會完全淹沒掉你的聲音。當火車的聲音出現後，較為輕微的聲音将無法被感覺到。

兩個信号在頻率上越接近，就越容易發生聽覺掩蔽，盡管可能其中一個聲音的音量隻是稍微大那麼一點點。比如說，如果兩個小号發出非常近似的高頻聲，音量較弱一點的小号将無法被聽到。但是，如果換成是一個低音鼓用相同分貝演奏，弱音量的小号則很容易被聽見，因為兩者的聲音頻率有顯著的不同。由于人耳的靈敏度依賴于頻率，是以掩蔽效果也就依賴于頻率。相比高頻音而言，低頻音之間需要離得更近才能被掩蔽，一般來說，弱純音離強純音越近（頻率相近）就越容易被掩蔽。

時域掩蔽

當一個高分貝的聲音出現後，它将淹沒掉緊跟其之前或之後的低分貝的聲音，這種現象稱之為時域掩蔽。通常時域掩蔽的時間範圍是在高分貝聲音之前或之後的幾毫秒，火車汽笛的轟鳴很容易掩蔽掉緊跟其後的微弱的哔哔聲。

為了充分利用這些聽覺特性，音頻壓縮算法将音頻頻譜劃分成許多次頻帶（sub-band）。每個次頻帶的動态範圍會單獨的縮減，是以動态範圍壓縮的效果就不是很顯著。這意味着可能每個采樣隻有2-4bit，而不是每個次頻帶中的音頻采樣都是16bit。次頻帶中也使用度量常數，每個次頻帶的bit配置設定也是獨立開的，是以重要的頻段區間具有更高的權重。次頻帶的大小會根據頻率的不同而不同，以适應人耳的頻率掩蔽。

MPEG-2 數字視訊技術參考指南（4）—— MPEG-2音頻壓縮

繼續閱讀

視訊播放 via FFmpegFFmpeg 簡介FFmpeg 指令行播放視訊FFmpeg + SDL 播放視訊其他架構下的播放

FFmpeg:AVCodecContext結構體解析AVCodecContext初始化結構定義及成員解讀

視訊特效濾鏡 via Media Foundation Transform (MFT)視訊特效定義Media Foundation Transform其他架構的濾鏡

音頻采集 via FFmpegFFmpeg 簡介FFmpeg 指令行采集音頻FFmpeg API 采集音頻其他架構下的采集

視訊轉碼 via FFmpegFFmpeg 簡介FFmpeg 指令行轉碼FFmpeg API 轉碼其他架構的轉碼

H.264 碼流結構解析 (整理)

采樣率,比特率,幀率,碼率

使用ffmpeg轉碼的MP4檔案需要加載完了才能播放的解決辦法

ffmpeg編譯裁剪

Opencore and OMX core/component interaction （二）

Live555實戰之交叉編譯live555共享庫

基于Windows 10系統編譯FFmpeg for UWP Prerequisites and First Time Setup Instructions

iOS 開發初級：AVAudioPlayer 的使用

live555學習筆記（二）

opencv 同态濾波實作 homofilter

二、主流視訊編碼标準的發展：H.261\H.263\MPEG-1\MPEG-2\MPEG-4一、發展曆程：二、H.261标準三、H.263标準四、MPEG-1标準五、MPEG-2标準六、MPEG-4标準

MPEG-2 數字視訊技術參考指南 （4）—— MPEG-2音頻壓縮

繼續閱讀

MPEG-2 數字視訊技術參考指南（4）—— MPEG-2音頻壓縮