天天看點

《計算機科學概論》—第3章3.4節音頻資料表示法

本節書摘來自華章出版社《計算機科學概論》一書中的第3章,第3.4節音頻資料表示法,作者[美]内爾·黛爾(nell dale)約翰·路易斯(john lewis),更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

3.4 音頻資料表示法

當一系列空氣壓縮震動我們的耳膜時,會給我們的大腦發送一些信号,我們就感覺到了聲音。是以,聲音實際上是由與我們的耳膜互動的聲波定義的。請參閱圖3-7。要表示聲音,必須正确地表示聲波。

《計算機科學概論》—第3章3.4節音頻資料表示法

一個立體聲系統通過把電信号發送到一個揚聲器來制造聲音。這種信号是聲波的模拟表示法。信号中的電壓按聲波的正比例變化。揚聲器接收到信号後,将引起膜震動,依次引起空氣震動(建立了聲波),進而引起耳膜震動。建立的聲波有可能與揚聲器初始接收到的完全一樣,或者至少能讓聽衆滿意。

要在計算機上表示音頻資料,必須數字化聲波,把它分割成離散的、便于管理的片段。方法之一是真正數字化聲音的模拟表示法。也就是說,采集表示聲波的電信号,并用一系列離散的數值表示它。

模拟信号是随電壓連續變化的。要數字化這種信号,需要周期性地測量信号的電壓,并記錄合适的數值,這一過程稱為采樣,最後得到的不是連續的信号,而是表示不同電平的一系列數字。

用存儲的電壓值建立一個新的連續電信号,可以使聲音再生。這裡有一個假設,即原始信号中的電平是均勻地從一個存儲的電壓值變化到下一個電壓值的。如果在短時期内采到了足夠多的樣本,那麼這種假設是合理的。但毫無疑問,采樣過程會丢失資訊,如圖3-8所示。

一般說來,采樣率在每秒40?000次左右就足夠建立合理的聲音複制品。如果采樣率低于這個值,人耳聽到的聲音就會失真。較高的采樣率生成的聲音品質較好,但到達某種程度後,額外的資料都是無關的,因為人耳分辨不出其中的差别。聲音的整體效果是受很多因素影響的,包括裝置的品質、聲音的類型和人的聽力等。

塑膠唱片是聲波的模拟表示法。電唱機(唱機轉盤)的唱針在唱片的螺旋形凹槽中上下伸縮,唱針的上下伸縮模拟了表示聲音的信号的電壓變化。

另一方面,雷射唱盤(cd)則存儲了數字化的音頻資訊。cd的表面是用顯微鏡可見的凹點,表示二進制數字。低強度的雷射将指向唱盤。如果唱盤表面是光滑的,雷射的反射強烈,如果唱盤表面有凹痕,雷射的反射就比較少。接收器将分析反射的強度,生成适當的二進制數字串,這是信号被數字化後存儲的數字電壓值。該信号将被重制,并發送給揚聲器。圖3-9展示了這一過程。

《計算機科學概論》—第3章3.4節音頻資料表示法
《計算機科學概論》—第3章3.4節音頻資料表示法

3.4.1 音頻格式

在過去幾年中,出現了多種流行的音頻資料格式,包括wav、au、aiff、vqf和mp3等。盡管所有格式都是基于從模拟信号采樣得到的電壓值的,但是它們格式化資訊細節的方式不同,采用的壓縮技術也不同。

目前,處于統治地位的壓縮音頻資料的格式是mp3。mp3的盛行主要源于它的壓縮率比同時期的其他格式的壓縮率高。即使将來能證明其他格式更有效,但現在mp3是大衆的最愛。在1999年中期,“mp3”這個詞的檢索頻率遠遠高于其他詞,而且現在還在盛行。讓我們看看mp3格式的細節。

3.4.2 mp3音頻格式

mp3是mpeg-2 audio layer 3的縮寫,mpeg是moving picture experts group(運動圖像專家組)的縮寫,這是為數字音頻和視訊開發壓縮标準的國際委員會。

mp3格式使用有損壓縮和無損壓縮兩種壓縮方法。首先,它将分析頻率展開,與人類心理聲學(研究耳朵和大腦之間的互相關系)的數學模型進行比較,然後舍棄那些人類聽不到的資訊,再用赫夫曼編碼進一步壓縮得到的位流。

網絡上有很多可用的軟體工具能幫助你建立mp3檔案。這些工具通常要求在把資料轉換成mp3格式之前,錄制品是以某種通用格式(如wav)存儲的,這樣可以使檔案大大減小。

解釋和播放mp3檔案的播放器有很多。mp3播放器既可以是純粹的計算機軟體,也可以像流行的蘋果産品ipod一樣是專用的硬體裝置,能夠存儲和播放mp3檔案。大多數mp3播放器允許使用者用各種方式組織他們的檔案,并能在回放時顯示特定檔案的各種資訊以及它們對應的圖形。

**2000年的故障

美國政府恢複了對一個至關重要的間諜衛星系統的使用,它正是因為在2000年計算機故障中損壞而出名的。在連夜維修之後,用來處理衛星傳回信号的地面連結才恢複了完整營運狀态。這一事故标志了一個罕見的間諜衛星系統失敗事件被揭露,而這一衛星系統是每年耗資2.9億美元的美國情報系統的核心。**