天天看點

自适應濾波:維納濾波器——GSC算法及語音增強

作者:桂。

時間:2017-03-26  06:06:44

連結:http://www.cnblogs.com/xingshansi/p/6621185.html 

聲明:歡迎被轉載,不過記得注明出處哦~

自适應濾波:維納濾波器——GSC算法及語音增強

  【讀書筆記04】

前言

仍然是西蒙.赫金的《自适應濾波器原理》第四版第二章,首先看到無限制維納濾波,接着到了一般限制條件的濾波,此處為限制擴充的維納濾波,全文包括:

  1)背景介紹;

  2)廣義旁瓣相消(Generalized Sidelobe Cancellation, GSC)理論推導;

  3)GSC應用——語音陣列信号增強;

内容為自己的學習記錄,其中錯誤之處,還請各位幫忙指正! 

一、背景介紹

在一般限制條件的維納濾波中,有${{\bf{w}}^H}{\bf{s}}\left( {{\theta _0}} \right) = g$的限制條件,即${{\bf{s}}^H}\left( {{\theta _0}} \right){\bf{w}} = g$.如${\bf{s}}\left( {{\theta _0}} \right)$為旋轉向量時,希望在$\theta _0$處保留波束—>對應$g_1  = 1$,希望在$\theta_2$處抑制波束—>對應$g_2 = 0$,寫成一般形式:

自适應濾波:維納濾波器——GSC算法及語音增強

寫成更一般的形式:

${{\bf{C}}^H}{\bf{w}} = {\bf{g}}$

假設$\bf{w}$權值個數為M,在一般限制維納濾波中可以看出:限定條件使得結果更符合預期的效果。假設C為M×L的矩陣:L個線性限制條件。對于M個變量的方程組,對應唯一解最多有M個方程,即:對于L個線性限制來講,我們仍可以繼續利用剩下的M-L個自由度進行限制,使得結果更加符合需求(比如增強某信号、抑制某信号等),這便是GSC的背景。

二、GSC理論推導

  A-理論介紹

書中的推導較為繁瑣,我們可以從投影空間的角度加以了解,也就是最小二乘結果的矩陣求逆形式,給出簡要說明:

對于矩陣A(N×M):
  • 如果A是滿列秩(N>=M)對于符合LA=I的矩陣解為:${\bf{L}} = {\left( {{{\bf{A}}^H}{\bf{A}}} \right)^{ - 1}}{{\bf{A}}^H}$;
  • 如果A是滿行秩(N<=M)對于符合AR=I的矩陣解為:${\bf{R}} = {{\bf{A}}^H}{\left( {{{\bf{A}}}{\bf{A}^H}} \right)^{ - 1}}$.

對于${{\bf{C}}^H}{\bf{w}} = {\bf{g}}$,得出最優解:

${{\bf{w}}_q} = {\bf{C}}{\left( {{{\bf{C}}^H}{\bf{C}}} \right)^{ - 1}}{\bf{g}}$

記:

${{\bf{w}}_{re}} = {\bf{w}} - {{\bf{w}}_q}$

為了便于對餘量${{\bf{w}}_{re}}$進行控制,将C擴充為:[ C | C$_{a}$ ],$\bf{C}_a$的列向量為矩陣C列向量張成空間的正交補空間的基,即:

${\bf{C}}_a^H{\bf{C}} = {\bf{0}}$

分析新的空間特性:

自适應濾波:維納濾波器——GSC算法及語音增強

上式有${{\bf{C}}^H}{{\bf{w}}_{re}} = {\bf{0}}$,這就說明隻要滿足該條件,${{\bf{r}}_e} = {\bf{C}}_a^H{{\bf{w}}_{re}}$就是補空間的餘量,如何保證一定有${{\bf{C}}^H}{{\bf{w}}_{re}} = {\bf{0}}$呢?可以将${{{\bf{w}}_{re}}}$寫為:${ - {{\bf{C}}_a}{{\bf{w}}_a}}$的形式,之是以添加$-$可能是因為正交補空間可以認為C列向量空間不能表征的成分,我們通常認為這一部分為該丢棄的殘差,也因為是殘差:${{\bf{C}}_a}$通常被稱為阻塞矩陣(取Block之意),很多書籍用$\bf{B}$表示。

 重新給出推導的結果:

${\bf{w}} = {{\bf{w}}_q} - {{\bf{C}}_a}{{\bf{w}}_a}$       s.t. ${{\bf{C}}_a}{{\bf{w}}_q} = {\bf{0}}$

對應結構圖為:

自适應濾波:維納濾波器——GSC算法及語音增強

簡化後可以認為上支、下支:

自适應濾波:維納濾波器——GSC算法及語音增強

這是維納濾波器的典型結構。

  B-阻塞矩陣的選取

阻塞矩陣這一段摘自:秦博雅《基于低複雜度自适應信号處理的波束成形技術研究》p22~23.

大緻有以下幾種方式:

自适應濾波:維納濾波器——GSC算法及語音增強
自适應濾波:維納濾波器——GSC算法及語音增強
自适應濾波:維納濾波器——GSC算法及語音增強
自适應濾波:維納濾波器——GSC算法及語音增強

三、陣列信号增強

學了這個GSC怎麼應用呢?這裡參考一篇07年adaptive beamforming(引用見最後的參考)的例子,簡要說明思路,關于阻塞矩陣。

文中結構圖:

自适應濾波:維納濾波器——GSC算法及語音增強

即:分别利用GSC架構,通過最小互資訊實作信号的分離,其中$w_a$、$C_a$即$B$都提前給定,優化$w_{a1}$、$w_{a2}$。

定義互資訊:

自适應濾波:維納濾波器——GSC算法及語音增強

其中,

自适應濾波:維納濾波器——GSC算法及語音增強
自适應濾波:維納濾波器——GSC算法及語音增強

在幅度(嚴格來講是傅裡葉系數幅度)為正态條件下,得到:

自适應濾波:維納濾波器——GSC算法及語音增強

給出輸出表達式:

自适應濾波:維納濾波器——GSC算法及語音增強

并給出準則函數——相關系數的表達式:

自适應濾波:維納濾波器——GSC算法及語音增強

其中,

自适應濾波:維納濾波器——GSC算法及語音增強
自适應濾波:維納濾波器——GSC算法及語音增強

其中相關、互相關無法得到統計資訊,仍然可以基于周遊性假設:利用時間換取空間,近似求取。

文中提到引入正則化(regularization)

自适應濾波:維納濾波器——GSC算法及語音增強

這個隻是優化過程中的限定條件,與GSC架構關系不大,不再補充。

這裡在網上找去了一個8通道(channel)的混合語音(兩個說話人),利用該算法進行分析,給出主要代碼:

主要代碼:

MMI_define_var(Xf1,Xf2);
%initialization
W1 = [0 0 0 0.1 0 0 0.2 ];
W2 = [0 2 0 0 0.2 0 0.1 ];
[Wa1,Wa2]=MMI_EstimateWa([W1 W2]');      

其中MMI_define_var定義變量:

function MMI_define_var(Xf1,Xf2)

global Wq B covX1X1 covX2X2  covX1X2  len;

Wq=[1 1 1 1 1 1 1 1]'*1/8;
B=[1 -1 0 0 0 0 0 0 ;0 1 -1 0 0 0 0 0 ;0 0 1 -1 0 0 0 0 ;0 0 0 1 -1 0 0 0 ;0 0 0 0 1 -1 0 0 ;0 0 0 0 0 1 -1 0 ;0 0 0 0 0 0 1 -1 ]';

[~,len]=size(Xf2);
XfMean1=mean(Xf1.');
XfMean2=mean(Xf2.');
for i=1:8
    Xf1(i,:)=Xf1(i,:)-XfMean1(i);
    Xf2(i,:)=Xf2(i,:)-XfMean2(i);
end

covX1X1=Xf1*Xf1'/len;
covX2X2=Xf2*Xf2'/len;
covX1X2=Xf1*Xf2'/len;      
MMI_EstimateWa實作參數估計:
      
function [Wa1 Wa2]=MMI_EstimateWa(W)
%obtain the Wa
ww=[real(W)' imag(W)']';

options = optimset('LargeScale','off','display','off');
[X,fval] = fminunc('MMI_real_imag_objfun',ww,options);
X_real=X(1:14);
X_imag=X(15:28);
Wa1_real=X_real(1:7);
Wa1_imag=X_imag(1:7);
Wa2_real=X_real(8:14);
Wa2_imag=X_imag(8:14);

Wa1=Wa1_real+sqrt(-1)*Wa1_imag;
Wa2=Wa2_real+sqrt(-1)*Wa2_imag;
end
      

對應結果圖:

自适應濾波:維納濾波器——GSC算法及語音增強

可以聽出來:雖然略有雜音,但兩個說話人的聲音已經實作了分離,GSC架構有效。如果不同說話人聲達時間估計準确,疊代算法應用合适,效果會更好,此處主要介紹GSC應用,細節不再琢磨,有興趣的可以探索探索。

參考:

  • K. Kumatani, T. Gehrig, U. Mayer, E. Stoimenov, J. McDonough and M. WÖlfel, "Adaptive Beamforming With a Minimum Mutual Information Criterion," in IEEE Transactions on Audio, Speech, and Language Processing, vol. 15, no. 8, pp. 2527-2541, Nov. 2007.
  • Simon Haykin 《Adaptive Filter Theory Fourth Edition》.