天天看點

EEG Feature Selection via Global Redundancy Minimization for Emotion Recognition 論文筆記

概述

提出了一種基于最小化全局備援的特征提取算法(global redundancy minimization in orthogonal regression)。

研究動機

基于EEG的情緒識别研究大多使用低密度(小于128個通道)的EEG資料,如SEED [71]和DEAP[72]資料庫。低密度腦電圖的缺點是其空間分辨率差。随着腦電裝置的發展,高密度腦電(超過 128個通道)因其高空間分辨率在情緒識别領域受到越來越多的關注 。與低密度腦電信号相比,高密度腦電信号可以為情緒識别任務提供更豐富的空間資訊。但基于EEG的情緒識别資料 [16]、[17]的樣本量小,高維EEG特征容易導緻分類器過拟合和情識别性能差。

在現有的研究中[26],[47],高度相關特征的特征排名往往是幾乎相等的,因為它們被認為對分類任務[26],[47]同樣重要 。結果表明,在選取的特征子集中,得分最高的多個EEG 特征互相依賴、互為備援[48]。由 備援的EEG特征不能提供額外有用的 資訊用于情緒識别,應該被去除[30]。

mRMR[20]和CMIM 方法[49]能在一定程度上最小化所選特征子集中的備援資訊。然而, 因為采用貪心政策評估特征相關性, 是以無法實作全局備援最小化, 所選擇的EEG特征子集不是最優輸出 [47],[48]。

解決方案

針對這一問題,文章提出了一種新的EEG特征 選擇方法,即基于正交回歸的全局備援最小化(GRMOR)。引入了一個全局備援評估項來計算EEG特征與其他特征的備援之和。該方法能有效地從全局角度識别備援腦電信号 ,進而獲得具有鑒别性的非備援腦電信号特征子集。

GRMOR 方法 将全局備援資訊引入正交回歸以準确評估備援資訊 高度相關的 EEG 特征之間的關系。 GRMOR 是最小化以下問題:

min ⁡ W , b , θ ∥ W T Θ X + b 1 n T − Y ∥ F 2 + λ θ T A θ  s.t.  W T W = I k , θ T 1 d = 1 , θ ≥ 0 \begin{aligned} &\min _{W, \mathbf{b}, \theta}\left\|W^{T} \Theta X+\mathbf{b} \mathbf{1}_{n}^{T}-Y\right\|_{F}^{2}+\lambda \boldsymbol{\theta}^{T} A \boldsymbol{\theta} \\ &\text { s.t. } W^{T} W=I_{k}, \boldsymbol{\theta}^{T} \mathbf{1}_{d}=1, \boldsymbol{\theta} \geq 0 \end{aligned} ​W,b,θmin​∥∥​WTΘX+b1nT​−Y∥∥​F2​+λθTAθ s.t. WTW=Ik​,θT1d​=1,θ≥0​

其中,A為備援特征矩陣(從公式上看像是一個魔改的餘弦相似度,矩陣中的每個元素代表兩個特征間的相似程度/備援程度) ,W是正交限制的投影矩陣。 Θ \Theta Θ 和 θ T 1 d = 1 , θ > 0 \theta^T1_d=1,\theta > 0 θT1d​=1,θ>0是對角矩陣。

A i , j = ( B i , j ) 2 = ( f i T f j ∥ f i ∥ ∥ f j ∥ ) 2 A_{i, j}=\left(B_{i, j}\right)^{2}=\left(\frac{\mathbf{f}_{i}^{T} \mathbf{f}_{j}}{\left\|\mathbf{f}_{i}\right\|\left\|\mathbf{f}_{j}\right\|}\right)^{2} Ai,j​=(Bi,j​)2=(∥fi​∥∥fj​∥fiT​fj​​)2

{ f i = H x i T f j = H x j T \left\{\begin{array}{l} \mathbf{f}_{i}=H \mathbf{x}_{i}^{T} \\ \mathbf{f}_{j}=H \mathbf{x}_{j}^{T} \end{array}\right. {fi​=HxiT​fj​=HxjT​​

H = I n − 1 n 1 n 1 n T H=I_{\mathrm{n}}-\frac{1}{n} \mathbf{1}_{n} \mathbf{1}_{n}^{T} H=In​−n1​1n​1nT​

優化算法:

算法4.交替優化W(GPI[69]), Θ \Theta Θ

算法說明:先固定 Θ \Theta Θ優化W,使用GPI算法。再固定W,優化 Θ \Theta Θ,過程中使用了增廣拉格朗日法對式子進行表換,通過算法3對 Θ \Theta Θ進行優化。

為什麼可以解決

為了說明GRMOR方 從全局角度最小化備援的機理,Eq.(11)中的全局備援最小化項θ ta θ可以 轉化為∑d i,j=1 Ai,jθi。GRMOR方法 首先采用基于正交 回歸的誤差最小項對EEG特征xi和xj的權重進行評分。Ai,j的 大值表示EEG特征xi與 xj高度相關。當θi > θj時,θj将變小到 使全局備援項最小化。也就是說,當 向量xi和xj互為備援時,在 疊代優化目标函數的過程中,θj的 值減小,θi的值保留。

上面是原文翻譯,以下為個人複述:

因為A是不變的,當 A i , j A_{i,j} Ai,j​的值很大時,證明兩個特征高度相關,此時兩個特征互為備援,當 θ i > θ j \theta_i>\theta_j θi​>θj​的時候 θ j \theta_j θj​會變小,進而在後期對特征進行排序,達到去備援的目的。

實驗

資料集

DEAP、SEED 、HDED。

DEAP:音樂誘發,32通道

SEED:視訊誘發 ,62通道

HDED:文章自行采集的128通道資料,視訊誘發。

**實驗範式 **

在實驗中,參與者被要求以一種舒适的方式放松地坐着,并保持長時間的注意力。每個實驗對象依次觀看12個電影片段。12個電影片段對應12個試驗的腦電圖資料,每個試驗包括以下步驟:

(1)一個視訊播放前5秒開始提示。

(2)一個電影片段3-5分鐘的顯示。

(3)觀看電影後50秒内對性興奮 和效價進行主觀自我評價。

(4)下一段影片前15秒的短暫休息。實驗過程如圖1所示。共有12個試驗,每個受試者的腦電圖資料。腦電圖記錄由經驗豐富的神經生理學專家進行檢查。

實驗流程

  • 資料處理:eeg資料經1 - 50hz帶通濾波器預處理。然後進行獨立成分分析以去除生理僞影。沒有進行切分。
  • 資料特征:12種。EEG信号分為5個頻率範圍:delta頻帶(1- 4hz)、theta頻帶(4- 8hz)、alpha 頻帶(8- 13hz)、beta頻帶(13- 30hz)和gamma頻帶 (30- 50hz)[77]。

效果

在3個資料集中與其他9種常見的特征提取算法進行對比,取得最好結果。

局限性

在半監督以及無監督學習中不一定有效。

繼續閱讀