天天看點

基于深度學習的運動想象腦機接口研究綜述

作者:資訊安全與通信保密

摘  要:近年來,随着腦機接口(Brain-Computer Interface,BCI)技術的進一步發展,對特征提取技術的魯棒性的需求也持續增加。深度學習(Deep Learning,DL)作為多層次的神經網絡模型具有從高維資料中進行特征提取并從分層表示中學習的能力,在分類識别任務領域中的表現優于手工選擇特征的傳統機器學習方法。深度學習模型可以自動學習高維的 EEG 資料集進而提取有效特征,是以基于深度學習的腦機接口成為該領域新的研究趨勢。卷積神經網絡(Convolution Neural Network,CNN)、深度信念網絡(Deep Belief Network,DBN)和遞歸神經網絡(Recurrent Neural Network,RNN)是深度學習中對腦電信号進行分析的三大主流算法。主要介紹了這三大主流深度學習算法的基本原理。為了探索能更好契合腦電資料特點的分類模型,還探讨了它們在BCI 中內建其他方法的實際運用。

内容目錄:

1  基于卷積神經網絡的運動想象腦電識别方法

1.1 卷積神經網絡

1.2 EEGNet 模型

2 基于深度信念網絡的運動想象腦電識别方法

2.1 深度信念網絡

2.2 基于微分熵的 DBN

2.3 基于小波包分析的 DBN

3 基于循環神經網絡的運動想象腦電識别方法

3.1 循環神經網絡

3.2 BLSTM

3.3 基于共空間模式的 LSTM

4 混合型網絡

5 結 語

腦機接口(Brain-Computer Interface,BCI)技術是一種能在人腦意識行為和外部裝置之間建立起不依賴于人體肌肉組織和神經組織的直接互動的通道。作為一種新型的人機互動技術,腦機接口是目前神經工程領域最活躍的研究方向之一,在生物醫學、神經康複和智能機器人等領域具有重要的研究意義和巨大的應用潛力。

運動想象(Motor Imagery,MI)是 BCI 研究領域常見的任務模式之一,在不同的運動想象狀态下,大腦皮層相關的區域産生與任務相關的腦電活動振蕩回應。基于腦電(Electroencephalogram,EEG)的運動想象腦機接口(MI-BCI)系統将采集到的某一具體的人腦意識任務信号進行處理和分析,并将模式識别結果轉化為相應的指令來控制外部裝置,被廣泛應用于康複醫學應用,如人工假肢的神經控制。MI-BCI 的出現為解決高度殘疾患者提高與環境的互動能力這一問題提供了新的解決方向,即将患者的意圖腦信号轉換為外部肢體的運動。

腦機接口技術的應用依賴于可以對腦電信号進行準确分類以及系統的魯棒性。BCI 系統常用的腦電信号特征提取方法(時域特征提取、頻域特征提取、空域特征提取)無法從高維腦電資料中提取出更有效的腦電特征,而深度學習(Deep Learning,DL)的自動學習高維資料選擇特征的特點解決了這一問題,且能夠在很大程度上緩解傳統的手工選擇特征的問題。通過深度學習強大的分析能力,可以實作對腦電信号的有效表征,為準确識别不同的大腦狀态提供了方向。

提取腦電信号準确有效的特征,難點在于腦電信号是一種随機性強、背景噪聲強、非平穩的信号,且不同被試者間存在較大的個體差異,這些都使腦電信号分析面臨着較大的挑戰。選擇合适的深度學習模型進行腦電信号分析,不僅是為了提高分類精度,也是為了解決在跨範式、跨被試、跨試驗情況下系統仍具有良好的魯棒性等問題。為選擇合适的深度學習模型,本文首先讨論了卷積神經網絡(Convolution Neural Network,CNN)、深度信念網絡(Deep Belief Network,DBN)和遞歸神經網絡(Recurrent Neural Network,RNN)等深度學習模型,以及在通用架構上改進的适用于腦電信号的深度學習模型變體,還讨論了深度學習模型和其他腦電特征提取方法結合的混合模型,最後讨論了深度學習模型之間的融合。

1

基于卷積神經網絡的運動想象腦電識别方法

1.1 卷積神經網絡

卷積神經網絡最早由紐約大學的 Yann Lecun于1998年提出,其本質是一個多層感覺機,主要思想是局部感覺(local field)、權值共享(sharedweights)和下采樣(subsampling),主要用于圖像與一維時序信号的自動特征提取和分類,其在計算機視覺和語音識别領域中的使用已經非常廣泛。使用 CNN 進行深度學習是生物醫學信号領域新的研究熱點,而且在 EEG 資料分析方面表現非常出色。CNN 是一種多層前饋神經網絡,其典型結構如圖1所示,主要由卷積層、激勵層、池化層和全連接配接層4種結構組成。

基于深度學習的運動想象腦機接口研究綜述

圖 1 CNN 典型結構

1.2 EEGNet 模型

1.2.1 EEGNet 模型的架構

Lawhern 等人提出的 EEGNet,是一種用于基于 EEG 的 BCI 的緊湊型的深層卷積神經網絡。在訓練資料有限的情況下,EEGNet 具有更強的泛化能力和更高的性能,可以有效地推廣到事件相關電位(Event Related Potential,ERP) 和 基 于 振 蕩 的BCI。此外,EEGNet 能提取出神經生理學上可以解釋的特征 。

如 圖 2 所 示,EEGNet 模 型 的 架 構 包 括 兩 個卷 積 塊 和 一 個 分 類 塊。第 1 個 卷 積 塊 包 含 了 一層 常 規 的 二 維 卷 積 和 一 層 深 度 卷 積(Depthwise Convolution,DC),第 2 個卷積塊使用了深度可分離卷積(Depthwise Separable Convolution,DSC),分類塊直接使用 Softmax 進行分類。并且在每一個卷積操作後都使用了 BN 操作,每一個卷積塊中都添加了 dropout,激活函數選擇了 Linear 函數和指數線性單元(Exponential Linear Unit,ELU)函數。圖2 中,參數 C 為原始腦電信号的通道數,T 是每個trail 的采樣點數,

基于深度學習的運動想象腦機接口研究綜述

是時間濾波器的個數,D 是空間濾波器的個數,

基于深度學習的運動想象腦機接口研究綜述

是點濾波器的個數,N 是類别數。在 Dropout 層,對于同一被試資料,分類任務以機率 p=0.5 随機斷開一部分神經元的連接配接,對于不同被試資料,分類任務則以機率 p=0.25 随機斷開一部分神經元的連接配接。

基于深度學習的運動想象腦機接口研究綜述

圖 2 EEGNet 模型架構

1.2.2 深度可分離卷積

深度可分離卷積是輕量級神經網絡的主要結構,其主要功能是在保證網絡非線性和充分利用特征資訊的同時,壓縮網絡結構,大大減少了模型的參數和計算量。深度可分離卷積結構上包含一個深度卷積層和一個點卷積層(pointwise convolution layer),其主要原理是先使用深度卷積對上層輸出的特征圖的空間資訊進行融合,然後使用點卷積對特征圖的通道資訊進行融合。

深度卷積是一個逐通道卷積的操作,具體實作是先将來自上一層輸出的 N 通道特征圖(feature map)拆分為 N 個單個通道的特征圖,再分别對它們進行單通道卷積,最後重新堆疊到一起。因為一個卷積核負責一個通道,一個通道隻被一個卷積核卷積,是以深度卷積層的卷積核數量是上一層輸出的通道數。

點卷積是一個逐點卷積的卷積操作,對來自深度卷積層的特征圖進行卷積,點卷積與正常的卷積操作很類似,隻是點卷積的卷積核的大小固定為(1,1)。是以,點卷積彌補了深度卷積沒有有效利用不同通道在相同空間位置上的特征資訊的不足。

1.2.3 EEGNet 模型的優點

EEGNet 模型的優點是使用了激活函數 ELU,以及架構上選擇了深度可分離卷積。ELU 函數融合了 sigmoid 函數和 ReLU 函數,右側的線性部分無飽和性,能夠緩解梯度消失問題,左側具有軟飽和性能,對輸入變化或者噪聲更魯棒。由于 EEG 信号是一種背景噪聲和随機性很強的非平穩信号,是以 ELU 函數抗噪聲能力強的特點很适合用來處理EEG 資料。架構上選用深度可分離卷積能夠減少網絡參數和計算量,使得模型能夠更快收斂。

1.3 基于圖譜的卷積神經網絡

1.3.1 小波變換的特點

一般的信号處理方法如傅裡葉變換在處理平穩信号、理想信号時表現比較優秀,但對于不平穩、随機性強的腦電信号來說并不适用。同時注意到,如果使用一個窗函數将不平穩信号切割成比較小的信号片段,就能将這些短時信号片段看成平穩信号,就可以使用傅裡葉變換對其進行分析,這種方式就是短時傅裡葉變換(Short-Time Fourier Transform,STFT)。然而其視窗的大小和形狀是固定的,不具有自适應性,是以在實際問題的應用中,無法很好地兼顧高頻譜資訊。在這樣的背景下,引入了小波變換(Wavelet Transform,WT)。小波變換也是常用的時頻分析方法,可以通過對小波基函數的伸縮和平移對原始信号進行多尺度分解。本文将尺度了解為時間視窗,較大的尺度因子對應着寬小波,頻帶較低,此時能得到原信号中的低頻成分資訊。是以對不同頻譜的信号都能進行比較全面的細化分析,具有多分辨率分析的優點。

小波變換像是一個數學顯微鏡,能夠放大局部信号的細節部分,這一優點是對短時傅裡葉變換的局部化思想的繼承和發展,同時又克服了短時傅裡葉變換視窗大小不具有自适應性等缺點。

1.3.2 小波時頻圖

Lee 等人提出了使用連續小波變換(Continuous Wavelet Transform,CWT) 提 取 腦 電 信 号 時 頻 特征,并将生成的小波時頻圖作為一維 CNN 的輸入。結果表明,與傳統的基于機器學習的分類方法相比,該模型具有更好的分類準确率。小波變換主要包括 CWT 和離散小波變換(Discrete Wavelet Transformation,DWT)。這裡讨論的是連續小波變換。連續小波變換将信号從時域轉換為時頻域進行分析。它的優點是能夠對小波基函數的尺度因子和位置參數進行調節,使小波變換能夠在短時間内适用于信号分析 。

Morlet 小波變換是連續小波變換的一種,其基本思想是:将連續的時間信号和 Morlet 小波進行卷積,進而獲得随時間變化的時頻能量分布。使用多尺度小波分解對原始腦電信号進行分解,不同運動想象任務下小波能量具有顯著差異,是以可以推斷在不同任務的運動想象狀态下,由小波變換得到的小波時頻圖能提取出有效特征。

這種方法将 EEG 信号從一維時間序列轉換為二維圖像來處理,通過對原始腦電信号進行連續小波變換得到的時頻圖作為 CNN 的輸入,得到任務分類結果。基于小波時頻圖譜的卷積神經網絡對運動想象腦電信号進行分類處理的方法屬于比較傳統的做法。

1.3.3  腦地形圖作為 CNN 的輸入

衆所周知,和傳統的機器學習算法相比,深度學習表現出更強的資料依賴性,在樣本量增加的時候,使用深度學習進行腦電信号分類可以得到更好的分類性能。由于使用小波變換一次試驗隻産生一個小波時頻圖,樣本量較少,是以 CNN 分類精度無法得到很大的提高。Ayman 等人在 2020 年提出的将一維腦電信号的時間序列轉換為二維腦電地形圖,每次試驗選取兩秒的時間窗,每一個采樣點産生一個地形圖,每次試驗能産生 2× 采樣率個地形圖,大大擴充了樣本量,同時也可以讓 CNN 從空間和時間兩個次元學習到不同運動想象任務的細微特征,是以可能得到更好的分類精度。

1.4 基于遷移學習的 VGG 網絡

1.4.1 遷移學習

BCI 線上系統通常需要在被試者使用系統前采集大量該被試者的腦電資料,進而對分類模型進行離線訓練。并且需要讓訓練資料和測試資料在相同的特征空間中,服從相同的統計分布 。然而采集被試者大量的資料比較困難,不同被試者的腦電資料之間存在較大的差異,直接使用其他被試者的腦電資料訓練分類模型對系統的魯棒性要求比較大。是以,為了克服腦電資料樣本量缺乏導緻網絡訓練不足的缺點,以及針對被試者個體間存在較大差異這一特點,提出的另一個方法是在深度卷積神經網絡的基礎上引入遷移學習。

遷移學習将在相關領域學習到的特征應用到目前領域的任務上來,使得模型在目标域中沒有大量腦電資料的情況下,通過在相似域中學習到的先驗知識也能對目标任務進行學習 。遷移學習是一種深度學習技術,基于卷積神經網絡的遷移學習用于快速準确地訓練一個 CNN,且 CNN 網絡參數不從0 開始初始化,而是把在其他被試者的腦電資料集上訓練好的模型參數遷移到該被試者的 CNN 模型并作為該模型的參數初始值。

1.4.2 VGGNet

VGGNet 是卷積神經網絡中具有優良分類性能的網絡模型。其特點是全部使用 3×3 的小卷積核和 2×2 的池化核來進行架構,每層卷積層包含 2 ~ 4 個卷積操作,其網絡深度一般為 11 ~ 19層, 比 較 常 用 的 是 VGGNet-16( 包 含 16 層) 和VGGNet-19(包含 19 層)。将多個小卷積核堆疊形成的一個卷積層代替隻包含一個大卷積核的卷積層,可以增加空間感受野、減少參數并且增加非線性映射次數,增強了模型對資料的拟合能力。VGGNet 不僅對大規模資料集有良好的分類效果,對小資料集也有良好的擴充能力。

遷移學習應用到腦電分析領域,将預先訓練好的深度學習網絡進行微調,讓它對新任務進行學習,需要通過以下幾個步驟實作:(1)由于 VGGNet的輸入要求是 224×224 的 RGB 圖像,是以需要先把腦電信号從一維的時間序列轉換為 224×224 的二維圖檔,實作方法可以參考本文 1.3 節。(2)選擇一個預先訓練好的 VGG 網絡。(3)使用新資料集訓練好的網絡層替換原來訓練好的 VGGNet 的最後面幾層,并指定輸出層的分類數。(4)選擇合适的優化器、初始學習率和 batchsize 等一些訓練參數并訓練模型。Raghu 等人提出了另一種方法,使用預先訓練的網絡直接從指定層中提取圖像特征,并使用 SVM 分類器對特征進行分類,也得到了比較好的準确率。

基于深度信念網絡的運動想象腦電識别方法

2.1 深度信念網絡

2.1.1 深度信念網絡概述

深 度 神 經 網 絡(Deep Neural Network,DNN)和簡單神經網絡架構上相似,但因其能對網絡輸入和輸出之間複雜的非線性關系進行靈活、高階的模組化而備受關注。DNN 也存在一些問題,當神經網絡的層數增加時,模型參數迅速增長,帶來了模型訓練時間長、反向傳播過程容易出現梯度消失且需要大量訓練樣本等一些缺點。為了解決深度神經網絡的訓練問題,Geoffrey Hinton 于 2006 年提出了DBN,其通過逐層訓練的方式解決了深層網絡的上述問題。DBN 的優勢在于通過無監督逐層訓練的預訓練方法,可以在不需要帶标簽資料的情況下生成模型權重,且逐層訓練的方式大大減少了計算量。預訓練結束後對帶标簽的資料使用 BP 算法可以對模型的性能進行調優,這在沒有大量标簽資料的情況下非常有效。

2.1.2 限制玻爾茲曼機

DBN 是 由 多 個 限 制 玻 爾 茲 曼 機(Restricted Boltzmann Machines,RBM)組成的,從底層到頂層逐層訓練。RBM 具體分為兩個層次,分别是可視層和隐藏層 ,其中可視層用于接收輸入的訓練資料,隐藏層用于提取特征,且具有層内無連接配接、層間進行全連接配接的特點。具體的逐層訓練過程:(1)最底層的 RBM 接收輸入層的原始訓練資料,經過訓練提取特征;(2)前一層 RBM 提取到的特征作為下一層 RBM 的輸入繼續訓練。于是将 DBN複雜的訓練過程簡化成對多個 RBM 進行訓練。

2.2 基于微分熵的 DBN

熵是熱力學中表征實體狀态的度量之一,其實體意義是表示體系的混亂程度。在資訊論中,資訊熵表示了信号的不确定性程度,是系統内資訊含量的量化名額。對于腦電信号這類随機性、不确定性強的信号而言,信号的具體取值具有很大的不确定性,是以資訊熵可以作為腦電信号所攜帶資訊量的度量。

微分熵是一種連續随機變量的熵,用來度量連續随機變量的複雜度。對于一定長度的腦電信号序列,它在某一頻段的微分熵等價于它在該頻段的能量譜的對數值,而取對數可以在一定程度上平衡高、低頻帶能量特征值之間懸殊的差距,是以使用微分熵特征作為 DBN 的輸入比傅裡葉變換直接得到的能量譜特征更能降低由于能量懸殊的差距給後續計算帶來的誤差 。

2.3 基于小波包分析的 DBN

小 波 包 分 解(Wavelet Packet Decomposition,WPD)是在 WT 的基礎上發展起來的,它克服了WT 在高頻段頻率分辨率較差、低頻段時間分辨率較差的問題,可以對中、高頻信号進行更好的時頻局部化的分析,是一種更精細的時頻分析方法。同時,WPD 繼承了 WT 的優點,可以根據被分析信号的特點,自适應選擇合适的頻帶與被分析信号相比對,提高信号的分析能力。

小波包分析方法利用多次疊代對原信号進行多尺度的小波包分解,再對小波包子空間的高頻和低頻資訊同時進行分解。選取合适的小波基函數和尺度因子是能夠提取到有效腦電特征的保障,且往往需要在實驗中不斷進行調整。小波包分析方法可以以小波系數的對數值、均值、方內插補點等作為特征,也可以提取多尺度的空間能量特征将其作為 DBN的輸入。

Lu 等 人提出了一種頻域深度信念網絡(Frequential DBN,FDBN)用于對 MI 任務進行分類。該模型首先使用快速傅裡葉變換(Fast Fourier Transform,FFT)和 WPD 提取 EEG 信号的頻域特征,并将這些特征作為 DBN 的輸入去訓練 DBN 網絡。結果表明,FDBN 的性能得到了顯著提升,并且對同一被試者跨會話的 MI-EEG 信号分類具有比較好的效果。

基于循環神經網絡的運動想象腦電識别方法

3.1 循環神經網絡

3.1.1 循環神經網絡概述

在傳統的神經網絡模型中,都是從輸入層經過隐藏層,然後再到輸出層,層間的節點是沒有連接配接的,也不會儲存任何狀态資訊 。而循環神經網絡(Recurrent Neural Network,RNN)是一種特殊的神經網絡,其核心部分是循環單元進行鍊式連接配接,對每一次輸出資訊都進行記憶并且作用于下一次輸出的計算中,隐藏層之間的節點建立起了連接配接,給定了目前輸入的上下文環境,對于處理時間序列問題有比較好的效果。是以,将 RNN 應用到腦電分析識别任務中。RNN 可以在預處理階段增強 EEG 信号,進而提高 BCI 性能,且 RNN 不會對混合在待濾波信号中的噪聲性質做任何假設,是以十分适合處理EEG 信号這樣的混合着未知特性噪聲的信号。RNN 的輸入可以是原始的腦電信号,也可以是提取的腦電特征。

3.1.2 長短時記憶神經網絡

1991 年,Hochreiter 等 人 提 出 了 RNN 有 長 期依賴的問題,在對長序列進行學習時,RNN 會出現梯度消失和梯度爆炸現象。為解決這一問題,Hochreiter 等人提出了一個結合基于梯度的學習算法的新型循環網絡結構,即長短時記憶(Long Short Term Memory,LSTM)神經網絡,其特點是在标準 RNN 網絡結構的基礎上引入了一個由 sigmoid層和點積操作構成的門單元(遺忘門、輸入門、輸出門)。實作 LSTM 需要經過 4 步:(1)通過遺忘門将目前輸入和前層輸出資訊中選擇性丢棄一些資訊;(2)通過輸入門的 sigmoid 層決定哪些是需要更新的資訊,tanh 層生成需要更新的内容;(3)更新細胞狀态;(4)通過輸出門輸出基于細胞狀态過濾後的部分。LSTM 通過控制上層輸出和目前輸入的記憶和遺忘程度選擇性存儲資訊,是以能實作長時記憶的效果。Leon-Urbano 等人使用多層 感 知 機(Multilayer Perceptron,MLP) 和 LSTM模型對手腳運動想象任務的資料進行分類,結果表明 LSTM 具有更好的性能 。Wang 等人提出使用一維聚合近似(1d-AX)提取的 MI 腦電特征作為LSTM 網絡的輸入的 AX-LSTM 模型具有較好的分類性能。

3.2 BLSTM

1997 年,Schuster 等 人提出了具有深度結 構 的 雙 向 遞 歸 神 經 網 絡(Bidirectional RNN,BRNN),它可以在兩個時間方向上訓練網絡并且同時最小化兩個時間方向上的目标函數,真正意義上給出了目前輸入的上下文環境。雙向和門單元的特點大大提高了 RNN 的學習能力。在此基礎上,Graves 等人于 2005 年提出了雙向長短時記憶(Bidirectiona LSTM,BLSTM)網絡,即把具有門機制的 LSTM 和雙向遞歸的 BRNN 結合起來,進而能夠獲得長時的上下文資訊,更有利于 RNN 網絡的學習。

BLSTM 把從兩個時間方向處理信号得到的特征向量組合起來用于識别 EEG 信号狀态的特征,這樣的結構能夠使線上系統更加準确地捕捉到運動想象事件發生的起點和終點,有利于連續腦電信 号 的 識 别 與 分 析。Sridhar 等 人 使 用 BLSTM 對左右手運動想象任務進行分類并取得了不錯的效 果。Ma 等 人 使 用 标 準 LSTM 和 BLSTM 的 并行網絡來學習 EEG 信号的時空資訊,充分利用了有限的資料并且在試驗之間具有更好的泛化能力。

3.3 基于共空間模式的 LSTM

基于空間濾波的深度學習是通過空間濾波提取EEG 通道間的差異性作為神經網絡的輸入。最常見的應用于 MI 任務的空間濾波方式是共空間模式(Common Spatial Pattern,CSP)。

Kumar 等 人提 出 了 一 種 結 合 CSP 和 LSTM網絡對 MI 任務進行分類的模型,該模型的主要工作流程是通過滑動視窗從空間濾波後的資料中擷取時間序列,并将其作為 LSTM 網絡的輸入。由于腦電信号中常常存在一些與任務無關的噪聲和其他非任務相關活動(比如眼電、肌電信号等),這些信号對 MI 任務的精确分類造成了比較大的影響,而該模型證明了對含非任務相關活動的不同 MI 任務進行實時分類的有效性。

CSP 是一種監督學習方法,訓練樣本是兩組含标簽的腦電資料。CSP 的目标是通過适當的矩陣變換,将高維的腦電信号轉換到低維子空間,得到的一個最優矩陣可以最大化兩類資料的方差。具體實作步驟是通過對每組訓練資料求平均協方差矩陣,然後對公共協方差矩陣進行主成分分解、白化等操作,将生成的白化矩陣作用于兩類訓練資料的平均協方差矩陣,使得兩類訓練資料方差最大化,此時兩組腦電信号具備了區分的特征。再通過主成分分解等操作得到公共特征矩陣 W,利用矩陣 W 得到投影矩陣。最後将投影矩陣作用到原始腦電信号上,得到腦電特征資料。測試資料通過公共空間濾波器能夠實作兩類資料的協方差最大化,即一類方差最大,一類方差最小,得到的特征向量增強了兩類資料的差别。采用近似聯合對角化(Joint Approximate Diagonalization,JAD)方法可以将兩類CSP 方法推廣到多類 CSP 方法 。

混合型網絡

單一的深度學習模型不能滿足對 EEG 信号進行全面分析的要求,除了其他方法和深度學習結合,這三大深度學習算法之間也進行一定程度的結合,進而更好地進行 EEG 信号的分析。在 MI 的分類識别任務中,CNN 和 RNN 是實際應用中采用最多的深度網絡架構。是以,在對 MI 任務進行分類識别的混合深度學習網絡中,常見的組合是 CNN 和RNN 混合。CNN 負責提取高維空間特征,RNN 負責提取出腦電信号的時間成分,兩者将時間和空間特征資訊整合,共同作用于腦電信号特征的提取。Yang 等人提出了一種結合 RNN-LSTM 和 CNN的并行特征學習方法,能夠捕獲原始的 MI 腦電信号的空間依賴性和時頻譜依賴性,提高不同主題的MI 腦電信号的分類精度。Garcia-Moreno 等人提出了一種基于 CNN 和 LSTM 的深度學習分類器來對左右手 MI 分類,Li 等人 對 CNN 和 RNN 混合架構的優化和建立模型超參數進行了論述。Zhang 等人提出了基于 3DCNN、LSTM 和 Deep Q-Network(DQN)的混合網絡,使用既保留拓撲結構又保留時間結構的 3DCNN 提取局部時空特征,再使用RNN 提取全局時間特征,從不同角度描述了腦電信号,然後使用 DQN 進行模糊積分優化,最後該模型在公開的 MI 資料集上驗證了其有效性和比較高的性能。

結  語

随着深度學習在計算機視覺、語言識别等領域的優異表現,越來越多的研究者開始考慮在腦電信号分析識别任務中使用深度學習模型來處理。

本文介紹了目前用于腦電分析的比較流行的三種深度學習的體系結構。為了克服腦電資料自身資料量少、背景噪聲大、随機性強、個體間差異大等不利影響,近年來這些體系結構混合傳統特征提取方法能更加全面地分析腦電信号。本文綜述了這些綜合多尺度特征資訊的模型在腦電分析識别領域的研究進展,同時對不同深度學習模型進行融合的混合型網絡做出了介紹。

不同深度學習模型進行融合共同作用于腦電分析識别也成為新的研究趨勢,而大多數研究者是使用對 CNN 和 RNN 進行融合的混合型網絡。這種混合型網絡不是簡單的串聯關系,而是并聯構造的混合型結構。深度學習在腦電信号分類識别領域的應用将朝着對 EEG 信号進行時頻空多尺度分析的方向發展。此外,現有研究針對 EEG 信号存在的異質性問題、跨會話和跨裝置等跨域問題還沒有提出較好的解決辦法,這些跨域問題的存在可能會引起EEG 的識别準确率的劇烈下降。是以,為提高 EEG信号的識别準确率,推進個性化運動想象腦機接口的進展,未來的發展将針對以上跨域問題提出較好的解決思路和解決方案,如使用域對抗和域自适應等手段實作域對齊。

引用格式:陳茂洲 , 劉化東 . 基于深度學習的運動想象腦機接口研究綜述 [J]. 通信技術 ,2023,56(6):673-681.

作者簡介 >>>

陳茂洲,男,碩士研究所學生,主要研究方向為醫學圖像處理、腦機接口;

劉化東,男,碩士研究所學生,主要研究方向為腦機智能融合。

選自《通信技術》2023年第6期(為便于排版,已省去原文參考文獻)

繼續閱讀