天天看點

【論文筆記】Chinese Named Entity Recognition Based on CNN-BiLSTM-CRF

主要思想

this paper proposes to use CNN to extract glyph- level features of Chinese characters 。卷積神經網絡(CNN)從每個漢字中提取具有形态特征的字形嵌入,将其與具有語義特征資訊的字嵌入連接配接起來,送入BiLSTM-CRF網絡

利用漢字的字元級和根級表示的BiLSTM-CRF神經網絡,在 MSRA資料集上實作最先進的性能90.95% F1。證明了基于字元的标注政策在沒有中文分詞結果的情況下也能達到相似的效果,這意味着漢字可以代替單詞成為識别命名實體的最小機關。

漢字由圖形組成,具有豐富的語義。對于一個中文學習者來說,通過這些圖形元件來了解一個漢字的意思是很常見的。是以,我們提出了一種新的基于字元的CNN-BiLSTM-CRF模型,該模型利用字元符号增強漢字的表示。符号嵌入由CNN直接從字元的位圖中提取,考慮了字元中的所有圖形元件,而不限于偏旁部首。然後将符号嵌入和字元嵌入連接配接起來,得到語義特征資訊,并輸入到BiLSTM-CRF網絡中。實驗結果表明,在不依賴于人工設計特征和領域知識的情況下,該模型的F-scores達到91.09%。

【論文筆記】Chinese Named Entity Recognition Based on CNN-BiLSTM-CRF

cnn的輸入是 Bitmap 字型

【論文筆記】Chinese Named Entity Recognition Based on CNN-BiLSTM-CRF

筆者認為此論文思想非常簡單,甚至有點奇特,将中文字元映射為bitmap格式的圖檔,然後使用cnn來學習結構特征。但是cnn真的學習到了結構特征麼?論文沒有給出證明,應該用bitmap做一個cnn的漢字識别模型,來訓練好cnn結構,提取出來的應該效果好些。

繼續閱讀