天天看點

回音消除技術概述

來源 http://www.qttaudio.com/aecjsgs.html

一、 回音消除技術的基礎概念

     回音消除已經替代了早期的回音抑制,回音抑制最早始于20世紀50年代,在衛星通訊環境中用來控制由于比較長的信号延時而聽到的回音。最早的回音消除理論在20世紀60年代在AT&T貝爾實驗室中發展起來,但是直到20世紀70年代末,由于受到電子行業的技術能力限制,商用回音消除産品一直沒有取得太大的發展。

     随着DSP的飛速發展使得回音消除産品變得更小和更具有成本效益。在20世紀90年代,回音消除器不再作為一個獨立的裝置,而是第一次被內建于語音網關中(加拿大北電公司DMS-250)。這個整合使得回音消除直接内置于語音網關中,意味着回音消除器可以在通話過程中非常可靠地被開啟或者關閉,在語音通訊和資料通信中區分不同的幹線組取得所需要的信号。

     1、回聲與延時的關系

     回聲和延時是兩個不同的概念,延時不會加重或者改變回聲的量值。聲音有一個遮掩效應,例如我們在山谷裡那麼清楚的聽到回聲的原因是因為聲音的傳遞時間長,聲音反射回來的時間就長,超過1秒甚至2秒,聲音的傳遞時間長了,聲音的遮掩效應會失去,這樣人的耳朵就會感覺到聽到這個回聲,回聲是一直存在的,專門的研究機構做過專門的測試,聲音的傳遞小于20毫秒左右的時候,遮掩效果發揮作用,人耳一般聽不出來,超過20毫秒以後遮掩效應開始衰減,超過50毫秒,聲音的遮掩效應就基本消失了,隻要有微弱的回聲人耳就能聽得到。

     2、回聲和數字延時及語音壓縮技術的關系

     數字延時技術就是把線性的信号,語音信号從喇叭或者電話中傳出去前,經過數字信号采樣處理會延遲一段時間,就使得回音回來延遲的更長,是以我們能夠聽到。而語言壓縮技術是對一段數字信号進行采樣後壓縮,然後再把這個壓縮信号送出去,這一段數字信号一般是30毫秒、40毫秒左右,語音資料經過拿出來做處理,處理之後,再送出去,這樣就增加了40毫秒的延時,導緻的結果就是有回音回來被聽到。例如我們現在的電話網絡都采用用數字交換機,而以前都是模拟交換機,送出的都是模拟信号,這個信号是以光速傳遞的,是以在模拟交換機時代,打本地電話和長途電話感覺不到有回音,隻有通過衛星打國際電話的時候聽到有回音,因為延遲時間就變長了,那麼打本地電話,電信号以光的速度傳遞,隻有幾毫秒,我們就聽不見感覺不到回音的存在,而現在的電話網絡全都用數字式的,它把電信号變成數字信号,而數字信号的處理,不是采一個數字就送出去,它是采集一段信号,可能是20毫秒40毫秒的信号進來了,把它處理一下,然後送出去,這樣的數字處理的效率很高,把信号先壓縮以後,再送出去,結果就是效率更高,本來一根線隻能送一路電話,現在可能送10個電話,但是提高效率的同時,增加了延時作為結果,這是就導緻回音的出現,例如我們打手機有回音,也是這種原因。

二、AEC(Adaptive Echo Control)回聲消除回音器的原理

     1、回聲消除原理

     回音的産生既複雜也簡單。一般喇叭信号出來聲音它會傳遞到麥克風,這個傳遞過程本身從技術上講就有一個傳遞函數,傳遞本身就已經發生了一些變化,在傳遞過程中,高頻和低頻的傳遞系數是不一樣的,通常低頻傳遞的效率更高,高頻傳遞的效率低一點 。麥克風跟喇叭的位置靠的越近,聲音傳遞的時間越短,稍微離的遠一點,那麼延遲的時間會多一點,即使聲音直接傳過去,信号就已經有時間延時了,麥克風位置的改變,回音也随之改變,傳遞的聲音随着距離位置的改變,它傳遞的時間也發生改變,接觸到信号也就改變了,但聲音除了這個直接信号以外,聲音在空間中它是往各個方向傳遞的,它會碰到牆壁、碰到天花闆反射回來,然後反射到麥克風,有的反射到桌面然後到麥克風,各個情況都存在,是以這是一個很複雜的問題,所有的信号最終的結果是疊加在一起的,疊加的結果就是有的信号被增強了,有的信号被減弱了,各種各樣的都有,然後牆壁對聲音信号的反射也不一樣,高頻低頻都不一樣,是以結果是一個複雜的所有疊加的結果,有的早有的晚,有的強有的弱,朗谷做回音消除呢,就是把總的傳遞函數效果算出來,那麼并不是簡單的說兩個信号一樣,這個你算出來的回音信号,跟送出去的參考信号,送到喇叭去的信号并不一樣,它已經經過了一些傳遞改變了,那麼可能有些已經延遲了100個毫秒,這是總的結果,回音消除的原理就是信号出去,然後麥克風收的信号肯定是這些信号各種各樣的直接間接的傳遞,反射回來的信号疊加到一起,我們把這些傳遞函數計算出來,疊加結果計算出來,這樣就能得到一個回音信号和麥克風信号,在理想條件下如果計算出來的和麥克風信号一樣,就可以把回聲消除掉,如果計算出來的有誤差,那麼就不可能消除幹淨,這就是回聲消除的原理。回聲消除技術後面還有很複雜的數學問題,最難的地方是變量太多,即回音模型的改變回音的疊加的結果都要計算出來。另外,還有采用回聲抑制進行回聲處理的方法——非線性的過度,就是兩邊同時說話的時候,它分辨不出那個是回音信号時,就剪切掉。這種處理不當,也可以說是單工。因為線性做的不夠好,還有回音時,就多切掉一點,稱之為回聲抑制。是以回聲消除和回音抑制是不同的。

2、回聲消除技術關鍵性技術名額

     (1)ITU-T的G.167

     這是國際電信聯盟有一個标準,這個标準要求任何回聲消除必須要做到降低45分貝以上,但是達到這個标準不是最好的,因為人還能聽到這個回聲,這個是最基本的标準。原則上麥克風信号收的信号有一個電平,這個電平我們可以用分貝來标示,如果這個信号的電平比如說是-3dB,如果你消除了30dB,那麼結果就變成了-30Db,因為10分貝能量上是10倍,20個分貝就是100倍,人耳能聽到的聲音範圍值大約是100萬倍,是以人耳朵能聽到能量範圍值是60分貝左右,回聲處理要消除60分貝以上人耳才聽不出來,如果隻消除30或者40分貝,能量降低到千分之一,萬分之一,雖然能量弱了很多,但還是能聽到。

     (2)回聲消除的帶寬

     窄帶模式頻率: 300Hz—3.4kHz

     寬帶頻率模式: 50Hz—7kHz(應用廠家ploycom/Cisco/skype)

     超寬帶模式:50Hz—14kHz,一般稱HD高清音頻模式

     全音域模式:20Hz—20kHz

三、AFC(Adaptive Feedback Control)自适應聲回報處理技術

     1、原理

     現場擴聲環境産生聲回報的問題是麥克風的信号到喇叭,從喇叭出來再到麥克風就造成了放大回路,形成聲回報。AFC技術就是讓從喇叭出來的信号回到麥克風,然後麥克風接收的喇叭信号給它濾掉和降低,AFC技術将此信号衰減10分貝,這樣就把它從喇叭出來的信号衰減了,這樣從放大器出來回到喇叭,就産生嘯叫,但是發言人說話的聲音,經過麥克風以後照原樣送出去,原樣又放大出來,這就是我們提高傳聲增益,但是又完成聲回報消除的最基本原理。AFC首先把模拟信号變成數字信号,然後采樣濾波,隻把從喇叭出來的信号回到麥克風的這一部分濾波濾、降低,然後再放大。

     2、特點

     (1)AFC無須調整

     朗谷的AFC技術不需要調整,麥克風移動、房間改變、濕度改變、溫度改變、氣壓改變統統沒有關系,不受任何影響。

     (2)AFC原音重放,聲音無改變

     AFC對說話人的信号、頻率等都不去改變,也沒有陷波器在裡面,是以AFC不影響系統的音質,而目前市場上大多數的聲回報處理技術都是采用陷波器的抑制技術,陷波器不管是什麼信号,不管是從喇叭出來的信号,還是人講話的聲音,都是把某些頻率陷進去,凹下去了,頻率響應應該是平的,原來是什麼聲音,重放出來還是什麼聲音,而陷波器的技術原理就是陷下去了,把這個頻率衰減下來,這就是陷波器的原理,也是目前用聲回報抑制技術進行信号處理劣化音質的問題所在,一隻兩隻話筒還可以,當多隻話筒尤其是多隻界面式話筒應用的時候,傳統的聲回報抑制技術是無法勝任的, AFC技術可以完美解決這個會議室聲學的棘手難題。

四、ANC(Adaptive Noise Control)自适應背景降噪技術   

     ANC技術保證清晰幹淨的語音信号傳遞,其技術原理是進行信号分析模型和信号的頻譜分析,這樣我們就能分析背景噪聲響應的強度和頻譜分布,然後根據這個模型就能設計一個濾波器,當有人講話的時候,同時進行信号分析,朗谷ANC就能分析出講話者的頻譜,那麼根據這些背景噪音和講話者的頻譜,這個濾波器根據兩個信号的對比實時的改變,讓講話者聲音頻譜通過,讓背景噪聲的頻譜濾掉,這樣的結果就是把背景噪聲濾掉了,當然不是完全的濾掉,比如說降低15到20個分貝,就很明顯可以感覺體驗到背景降噪的效果。

五、AGC(Automatic Gain Control)自動增益控制技術

     AGC自動增益控制也稱為智能電平控制(ILC)技術,自動增益控制提供語音電平調節能力,它把減弱了的和加強了的信号映射到一個使用者定義的最理想電平。不像普通的産品,在這些産品中隻增加減弱信号的增益,而不理會增強了的信号, AGC是雙向的,并且不僅僅是一個固定電平的增益或衰減。一些增益控制技術使用一個固定的失真——補償類衰減來減少對大聲語音的修剪,但把這種失真加到了所有信号之上,這使輕柔的語音更難以聽清楚。AGC具有區分加強了的信号和輕柔信号的能力,避免了這種問題,同時保持住對話聲調的連貫和讓話音易于聽清楚。

為了維持聽感上的舒适性,對可以應用到AGC和NC的增益和衰減有一個限制,最大值是12dB。例如,假如輸入的話音電平為-18dBu,并且AGC設定為-12dB,AGC将會把語音放大6dB來維持一緻的設定語音電平值(-12dB)。當噪聲出現時,NC會根據引入噪聲的電平把語音放大到AGC設定電平之上,最多放大額外的6dB(AGC+NC=<12dB)。如果輸入的語音加強得太多,最大可能的NC增益會太大,并可能導緻語音失真。為了補救這種失真,AGC提供了一個防止飽和電平,它設定了一個-6dBu的預設最大語音電平。這就限制了NC能夠增大的增益量,是以能保證語音總是可懂并且聽起來舒适。 

     此外,必須注意避免讓NC放大電平很低的回聲或背景噪聲,這些雜音可能會由呼叫的遠端洩漏進來。為了防止這種放大,NC必須能夠從語音中分辯出這些信号,并隻放大話音而不放大任何低電平背景噪聲或回聲。 

     噪聲補償、自動增益控制以及這些功能特征的結合引出了一個新的、唯一的概念──智能電平控制(ILC)。普通産品隻能提供一個基于設定值的固定增益電平(或衰減電平),而ILC技術适合于指定呼叫特征,調整語音到理想的收聽電平,并在整個呼叫過程中動态地再作調整,以達到一個清晰、持續的、可聽懂的語音信号。

繼續閱讀