Reasoning about Entailment with Neural Attention-學習筆記

2023-07-31 01:57:18

Reasoning about Entailment with Neural Attention

LSTM可以學習豐富的語句表示，這些語句适合于确定文本含義。LSTM神經網絡很适用于文本蘊含類的任務。
針對識别文本蘊含(RTE)任務提出了一個帶有注意力的神經網絡。文中的模型能夠處理以前提為條件的假設來推理詞與詞，短語與短語之間的蘊含關系。
文中的整個模型的架構：

Reasoning about Entailment with Neural Attention-學習筆記
使用兩個LSTMs（A）識别文本蘊涵，一個在premise上，一個在hypothesis上，以及注意僅基于最後輸出向量（h9，B）或逐字注意基于假設所有輸出向量（h7，h8和h9，C）。
word2vec vectors其實就是簡單化的神經網絡，在[1]中使用了word2vec向量作為字元向量的初始，但并沒有在訓練時進行優化。https://arxiv.org/pdf/1509.06664v1.pdf
使用線性層把詞向量映射到LSTM的隐藏層大小的次元，形成輸入量x_i。
使用softmax層對輸出向量的非線性映射的輸出進行分類（導緻，不相幹，沖突），使用交叉熵進行訓練。
擁有注意力的LSTM RTE模型不需要掌握細胞狀态的premise整個語義含義。
為了确定一個句子是否蘊含另一個句子，最好的方法就是檢查每個詞和短語對的蘊含或沖突的關系。
Word-by-word的attention機制，與基本的attention模型不同的是，不是用注意力來生成單詞，而是通過在前提和假設中對單詞和短語進行軟對齊，從細粒度的推理中獲得一個句子對編碼。該模型可以生成一個權重矩陣，這時候計算權重并不是使用前LSTM的末态，而是使用前者的全部隐藏輸出。進而建立起兩個文本序列之間的關系。
加了two-way attention的效果并沒有更好，反而更差。[1]分析認為是因為用了相同的參數來做two-way可能會給訓練帶來更多的影響，所有效果不好。

Reasoning about Entailment with Neural Attention-學習筆記

繼續閱讀

論文閱讀筆記（三）：Research on Network Attack Effect Evaluation Based on Confrontational Perspective一. 論文簡介二. 創新點和貢獻：三. 相關領域的概述(related work)四. 作者的方案五. 主要的資訊流（approach）六. 總結

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普