天天看點

畫質語音都清晰!攝像頭上的那些音視訊黑科技

随着時代的發展和科技的進步,如今攝像頭産品在功能和性能上都有了巨大提升。在應用範圍上,除了搭配PC使用外,攝像頭在視訊會議、直播帶貨等商用領域也被廣泛使用。為了提升攝像頭的使用體驗,很多廠商在産品上加入了許多新技術,比如讓攝像頭對焦更快、更精準,讓攝像頭擁有更好的音頻體驗等。本期,我們就來聊聊攝像頭上的那些音視訊黑科技。

畫質語音都清晰!攝像頭上的那些音視訊黑科技

▲Rocware RC08左側為揚聲器,右側為攝像頭,攝像頭邊緣部分是它的TOF雷射對焦系統。

市場痛點:功能全面的攝像頭鳳毛麟角

在電商網站上以“攝像頭”為關鍵詞進行檢索,你會發現其中絕大部分産品都隻內建了麥克風功能,帶揚聲器的攝像頭并不多見。那麼為什麼很多攝像頭本身沒有內建揚聲器呢?首先,當內建了揚聲器後,成本會有所增加;其次,揚聲器與麥克風都內建在一個攝像頭上,當麥克風采集音頻時會遇到揚聲器發出的聲音,這就導緻揚聲器自己發出的聲音會被再次采集然後又通過揚聲器播放出來,如此反複就形成了回聲,如果調校不好,會影響使用者體驗;最後,如果麥克風不支援噪聲抑制,當環境中存在其他雜音幹擾,就會影響音質的采集,對方和自己聽到的聲音品質就會大打折扣。如果加入噪聲抑制和回聲消除,這會進一步增加成本,這也是很多攝像頭都不帶揚聲器的原因。

目前,市面上有少部分麥克風揚聲器一體的攝像頭,不過絕大部分都是名不見經傳的獨幕喜劇牌。這類産品通常都是采用不到百元的監控攝像頭的方案,麥克風拾音效果差,揚聲器更是談不上音質,隻是滿足使用者“聽個響”而已。由于受成本限制,像專業的噪聲抑制、回聲消除等功能都不支援。

此外,在畫質方面,雖然目前有很多攝像頭都将分辨率提升至4K,但在對焦方面還是存在很大的問題,比如MC評測室曾用于直播的某款中高端攝像頭,經常出現對焦慢、對焦不準、反複對焦的問題。也就是說,目前大部分攝像頭都隻是将重點放在了拍攝的分辨率上,而在音頻、對焦等方面存在短闆。

那麼市面上有音頻品質和各方面功能都比較出色的攝像頭嗎?有,不過産品鳳毛麟角。我們在市面上找到了一款在各方面表現都比較均衡的攝像頭:Rocware RC08,号稱是內建了全高清錄影機、全向麥克風、全頻揚聲器一體的攝像頭,同時内置3A算法(AEC/AGC/ANS)、TOF雷射對焦等黑科技,并支援全雙工對話,是由國内著名的音視訊通信裝置品牌維海德推出。那麼,這款産品是真的可以解決使用者的痛點還是“王婆賣瓜”呢?我們接下來會對它進行拆解,分析它的内部用料并解析它的3A算法黑科技。

畫質語音都清晰!攝像頭上的那些音視訊黑科技

▲Rocware RC08拆解圖

畫質語音都清晰!攝像頭上的那些音視訊黑科技

▲Rocware RC08架構結構圖

SSC333主要晶片+ SC2239圖像傳感器+HT8693功放晶片

拆解後可以看到Rocware RC08采用了一顆SigmaStar(廈門星宸科技有限公司)SSC333主要晶片,該晶片被廣泛應用于家用監控和攝像頭領域。據公開資料顯示,SSC333采用了單核心設計,主頻為800MHz,基于ARM Cortex-A7架構。雖然SSC333的核心數不多,但是它卻擁有非常高的內建度。比如它内置了ISP圖像信号處理器、H.264和H.265以及MJPEG視訊編碼器等。

另外,它還支援音頻輸出,并具備音頻模數轉換器(ADC)和數模轉換器(DAC)等外圍裝置接口,以實作擴充的靈活性。SSC333相容G.711、G.726、ADPCM多種音頻編碼格式,還能支援3A(AEC、ANS、AGC)音頻算法,這也為Rocware RC08的音頻表現奠定了基礎。此外,SSC333内置了512MB DDR2記憶體,支援WDR、多級降噪、多種圖像增強和矯正算法,能提供更好的圖像品質。

畫質語音都清晰!攝像頭上的那些音視訊黑科技

▲Rocware RC08采用的SigmaStar SSC333主要晶片結構圖

與SigmaStar SSC333主要晶片搭配的還有一顆來自SmartSens(上海思特威)的SC2239圖像傳感器,這顆CMOS主要用于監控系統、網絡錄影機、行車記錄儀、運動相機以及視訊會議的攝像頭領域。SC2239擁有200W像素,像素大小為2.9μm×2.9μm,尺寸為1/2.8英寸,最高支援1920×1080@30fps分辨率的圖像。SC2239擁有高光敏度和高信噪比,信噪比為38dB,同時還支援850nm/940nm波長的紅外燈。

為了讓攝像頭擁有更好的聲音表現,Rocware RC08加入了一顆嘉興禾潤電子科技有限公司生産的HT8693單聲道功放晶片。這是一顆具有AB類和D類兩種工作模式的音頻功率放大器,在D類模式4Ω的負載下,可連續輸出11W的功率。該晶片具有防破音輸出控制功能,能夠自動監測輸入的聲音信号幅度過大導緻的輸出聲音出現破音問題,并可以提高聲音品質。此外,它還內建了免濾波器數字調制技術,能夠直接驅動揚聲器,并最大程度降低輸出信号的失真和噪聲問題。

畫質語音都清晰!攝像頭上的那些音視訊黑科技

▲Rocware RC08采用的HT8693單聲道功放晶片支援AB類和D類兩種工作模式。

可以看到,RC08在機身内部最主要的核心晶片上都是采用的大陸企業的自主産品,這也說明在視訊監控、攝像頭領域的晶片已經實作了自主可控。當然,為了確定産品的品質,RC08所采用的晶片都是國産中的頭部企業,真正實作了自主可替代。

3A算法黑科技讓音頻性能大幅提升

如果說硬體是産品的軀體,軟體是靈魂,那麼算法就是中樞神經系統。優秀的算法能讓硬體的性能得以充分發揮,為了讓Rocware RC08在音頻效果上擁有更好的體驗,它通過算法技術讓産品在搭配了麥克風和揚聲器的同時還能消除噪聲和回聲幹擾。相信很多讀者好奇這是如何實作的呢?接下來我們将對它的算法技術進行解析。

Rocware的工程師賦予了RC08優秀的3A算法—AEC(Acoustic Echo Cancelling,回聲消除)、AGC(Automatic Gain Control,語音自動增益控制)、ANS(Active Noise Suppression,主動噪聲抑制)。那麼這個3A算法是如何工作的呢?

畫質語音都清晰!攝像頭上的那些音視訊黑科技

▲AEC回聲消除算法技術的原理本質是将聲音進行比對,然後将噪聲消除。

假如RC08在的揚聲器在播放聲音時,聲音通過空間傳播、反射後,會再次被它的麥克風采集到,同時再遇到說話的聲音時,如果沒有AEC算法,那麼就會導緻通話中一直循環往複地聽到自己的回聲。AEC算法的作用是将不需要的回聲從語音流中篩除,通常最常見的算法是對消。AEC通過揚聲器信号與揚聲器所産生的回聲信号,建立一個語音模型,再通過它對回聲進行估計,然後不斷地修改濾波器系數,讓建立的語音模型估計值接近真實回聲值。最後再将回聲估計值從麥克風的輸入信号中互相抵消,進而達到消除回聲的目的。如果算法中的估計值越準确,那麼過濾的回聲效果就越好。另外,AEC還可以将麥克風的輸入值與揚聲器的輸出值對比,然後過濾掉經過多次反射回來的延遲回聲。

畫質語音都清晰!攝像頭上的那些音視訊黑科技

▲AGC的作用是自動放大或降低語音信号,讓輸出的語音不會忽大忽小始終保持在人的聽覺範圍之類。

那麼問題來了,當輸入的語音信号很弱時,是不是AEC算法就不起作用了?這個時候AGC算法開始工作了。我們在日常面對面交談時的聲音大小通常在40~60dB左右,如果兩個人距離稍遠,聲音低于30dB時,聽起來就比較吃力,如果聲音過大,比如超過100dB的時候,又會讓人不舒服。AGC的作用則是将聲音調整到合适的範圍,它分為模拟調整與數字調整兩種方式,模拟調整是通過麥克風的采集,數字調整則是通過聲音資料流的數字電平調整。當輸入信号很弱,那麼AGC就會自動放大語音信号,當輸入的語音信号過大,就會進行抑制,讓輸出的語音不會忽大忽小。

當回聲的問題解決了,事實上還有來自外部環境的噪聲,比如公共場所中嘈雜的人聲、播放音樂的聲音等。如果裝置将這些噪聲也采集後,會嚴重影響通話的品質。此時,就需要用到ANS噪聲抑制算法了。ANS算法的作用是對有幹擾的聲音信号進行壓制和消除,同時改善語音信号的信噪比和語音清晰度,讓人與機器都能聽得清。噪聲有平穩和瞬時噪聲兩種類型,其中前者的噪聲頻譜比較穩定,而瞬時噪聲的頻譜持續時間短并且沒有諧波等特點。利用噪聲的特點,為聲音資料加入反向的波形,最終消除噪聲。

Rocware RC08通過采用一個全向麥克風收集語音和噪聲信号,然後再對麥克風采集的輸入信号與數字信号比對,進而過濾掉環境中的噪聲。這種單麥克風采集和過濾噪聲信号的方式采用的算法更加複雜,并且對算法技術的要求更高。

畫質語音都清晰!攝像頭上的那些音視訊黑科技

▲根據噪聲的特點和類型,為聲音資料加入反向的波形,最終消除噪聲。

TOF雷射對焦:快、準

我們知道,不論是手機還是攝像頭甚至是投影機,自動對焦是非常關鍵的性能之一。Rocware RC08為了獲得更好的成像效果,它加入了TOF雷射對焦模組。對焦的方式有很多種,比如有相位對焦(Phase Detection Auto Focus,PDAF)、反差對焦(Contrast Detection Auto Focus,CDAF)、雷射對焦(Laser Detection Auto Focus,LDAF)等。由于相位對焦和反差對焦都是通過外界光感進行的對焦,是以對環境光線要求較高,如果環境光線較暗,就會導緻對焦速度變慢。而雷射對焦方式則不存在這種問題,它是通過發射紅外光線,借助被反射回來的紅外光計算出拍攝的物體之間的距離,然後對焦馬達開始移動進行對焦。哪怕是在暗光環境下也能實作快速對焦,不過發射的紅外光距離有限,它更适合在室内的環境中使用。像Rocware RC08這類攝像頭采用了雷射+TOF相結合的方式,不僅能做到對焦速度快,而且也更準。它可以計算光線從光源到被拍攝物體或人體的時間,進而計算出被拍攝物體或人體的深度資訊。

畫質語音都清晰!攝像頭上的那些音視訊黑科技

▲TOF雷射原理。

相對來說,采用TOF雷射對焦成本相對更高,非常适合應用在視訊會議、直播這些專業應用場景。那麼如何分辨攝像頭是否采用了雷射對焦呢?以Rocware RC08為例,可以将攝像頭通電後,将手機攝像頭對準它的雷射對焦發射器,手機螢幕上會出現紅色的反光,就證明這是一款真正的雷射對焦攝像頭。

寫在最後

我們可以看到,其實在一款小小的攝像頭上也能有優秀的音視訊效果。不過在産品的背後,需要有紮實的用料、出色的設計以及優秀的技術,才能在衆多産品中獨樹一幟。Rocware RC08正是這樣一款産品,主要、COMS、功放晶片一應俱全,并通過3A算法(AEC/AGC/ANS)、TOF雷射對焦等黑科技,再結合國際一線品牌音響調校,讓畫質、語音都能清晰呈現。當然,這隻是從硬體和技術方面的解析,在實際表現方面如何,我們在接下來的一期中會對RC08進行全面的體驗,敬請期待。

繼續閱讀