Attention Is All You Need 中的self-attention 以及multi-head attention

2023-07-31 01:57:32

前言

attention在語音識别方面越來越受大家的歡迎了，無論是soft attention以及hard attention等等都被大家廣泛應用，從今天起筆者将基于一篇篇的頂會，來複現各家的attention的算法，今天就分享self-attention。

self-attention

Attention Is All You Need 中的self-attention 以及multi-head attention

如圖所示文章中的經典圖例

所采用的公式

Attention Is All You Need 中的self-attention 以及multi-head attention

也就是引入了QKV三個值，用這三個值進行一如上公式，進行系列的操作

代碼展示：

import tensorflow as tf 
import math
length=50#幀長
input=39#MFCC特征維數
###########輸入資料
x = tf.placeholder(tf.float32,[None,length,input])#輸入資料


def self_attention(x,hidden_layer,head):
    x=tf.layers.conv1d(x,hidden_layer*3,1,strides=1, padding='same')
    Q,K,V=tf.split(x, 3, axis=2)
    print(Q,K,V)
    K=tf.transpose(K,[0,2,1])
    print(K)
    result=tf.reduce_sum(tf.matmul(Q,K)/math.sqrt(hidden_layer),axis=1)
    print(result)
    result=tf.reshape(result,[-1,50,1])
    result=tf.nn.softmax(result)
    V=V*result
    return V

采用tf.split函數分離出Q，K，V，然後Q與K矩陣相乘，求和，經過softmax最後與V相乘，得到了單頭注意力機制的結果

既然有個單頭的算法了，如何變成多頭的呢？

我們先來看一下論文裡寫的：

Attention Is All You Need 中的self-attention 以及multi-head attention

他是這麼做的呢，他是先把一個語料最後一維先分成h份最後concat到了一起，并且文章中的這句話也驗證了我們的研究：

Attention Is All You Need 中的self-attention 以及multi-head attention

文章中采用的是h=8，這裡我們采用5。

def multi_head_attention(x,head,output_channel):
    xn=tf.split(x,head,axis=2)
    print(xn)
    V1=xn[0]
    print(V1)
    V1=self_attention(V1,32)
    for a in xn[1:]:
        V=self_attention(a,32)
        V1=tf.concat([V1,V],axis=2)
    print(V1)   
    V1=tf.layers.conv1d(V1,output_channel,1,strides=1, padding='same')
    return V1

這樣就比較輕松的完成了multi-head attention的代碼編寫

Attention Is All You Need 中的self-attention 以及multi-head attention

前言

self-attention

繼續閱讀

《燃冬》：冰封之下，情緒洶湧

《野蠻人入侵》裡的東南亞文化魔方：“我”是誰？

曾被劇方毆打毀容的孫菲菲，13年沒等來道歉，隻等來資本的甩鍋

自揭傷疤的孫菲菲：曾被譽為古裝第一美女，緣何巅峰期隕落 | 晚八點娛聞

3部片成本5億虧了3億，邱禮濤不甘心，找劉德華帶來一部生猛大片

為梁朝偉的眼眸幹杯｜面孔

奧來德（688378）：國内顯示光刻膠龍頭積極拓展鈣钛礦領域丨公司研究

《第八個嫌疑人》不及格，但大鵬的演技，配得上影帝的稱号嗎？

誰在支援郭敬明？

又美又飒，這些女人給我看迷糊了

太氣了！《雲之羽》大結局稀爛，郭導演“男女情”就那麼難拍嗎？

尺度狂飙，4集就被緊急停播！這200+億國産流量要完了？

被官媒點名批評，強吻、襲胸、打人，這些“借題發揮”何時休？

胡歌+吳磊，票房慘敗！電視咖難撐大銀幕？

專訪｜亞運會開幕式總導演陸川：在我的概念中，“橋”是個重要元素

12部影片國慶檔厮殺，《前任4》遙遙領先，第五代導演能行嗎？