More Data, More Relations, More Context and More Openness:A Review and Outlook for Relation Extraction
作者:李瑾
機關:燕山大學
論文位址
目錄
- 一、概述
- 二、關系抽取的發展
- 三、存在的問題及發展方向
- 四、面臨的挑戰
一、概述
關系抽取定義: 關系抽取是資訊抽取的任務之一,其任務是從文本内容中找到概念之間的語義關系,和知識圖譜有密切的關系。
本文詳細介紹了關系抽取的發展,總結了現有關系抽取存在的問題以及四個有前途的發展方向,并進一步研究了現有的關系抽取模型所面臨的兩個關鍵挑戰。
二、關系抽取的發展

三、存在的問題及發展方向
四、面臨的挑戰
1. 從上下文資訊和實體名稱中擷取資訊
作者對上下文資訊和實體名稱是否對擷取關系資訊起到了作用以及哪個起到的作用更大進行了如下消融實驗,實驗結果如下圖所示。
其中,ME表示将實體名稱替換為特殊字元,OE表示僅提供實體名稱。 作者通過消融實驗證明了上下文資訊和實體名稱對關系抽取都起到了很大的作用,其中實體名稱所起的作用相對更大。但人類對于句子關系往往是通過上下文描述來擷取,故還需要在了解語言如何表達關系方面做跟多的研究。
2. 缺少針對特定問題資料集
目前針對有監督關系抽取已經提出了很多資料集,但幾乎沒有針對特定問題的資料集(例如,兩個實體在兩個不同的句子中被提及),這對相關問題的研究帶來了困難。為了進一步研究這些在資訊抽取發展中具有重要意義的問題,有必要針對特定問題建構公認的、設計良好的和細粒度的資料集。