天天看點

《中國人工智能學會通訊》——7.18 篇章語義分析的應用

由于篇章語義分析以篇章結構和語義資訊為分析目标,是以對機器翻譯研究(MT,MachineTranslation)的促進作用最為直接。在已有的工作中,研究人員利用篇章語義分析技術從很多角度輔助機器翻譯系統的性能提升。首先,篇章語義分析研究結果能夠刻畫 MT 系統的輸入文本塊之間的語義關系,這對 MT 系統更合理地組織翻譯結果無疑是有益的[36] 。此外,篇章語義分析對關聯詞、文檔結構都進行了比較深入的分析,這些資訊有助于提升翻譯文本的連貫性,生成可讀性更好的翻譯結果[37-38] 。

另外,篇章級别的機器翻譯評價始終是一個難題,通過引入篇章語義分析研究結果,可以在篇章層面上利用核函數捕捉結構資訊,有助于更好地進行翻譯品質評估[39-40] 。

自動問答系統(QA,Question Answering)是另一個從篇章語義分析研究中受益的重量級應用。通常情況下問答系統包括問句了解和答案抽取兩個子產品。在問句了解部分,篇章語義分析有助于了解題幹各部分之間的語義關系,進而加深對問題的了解[41] ;在答案抽取方面,篇章語義分析可以用來更精确地分析答案所在文本[42] ,進行候選答案的重排序,有助于更準确的回答問題[43] 。除了傳統 QA 研究之外,近年來閱讀了解研究也受到了越來越多的關注。閱讀了解的任務是對于給定的一篇自然語言文章和給定與文章相關的問題,計算機根據詞語特征等語義資訊來自動選擇與問句相關的候選答案句。在閱讀了解任務中,文章主題的廣泛性要求對語料庫進行深度加工和處理,才能得到比較好的結果。閱讀了解研究可以直接應用到許多的社會領域,它不但是自然語言處理的一個重要的研究方向,而且可以對自然語言處理技術的成熟有很大促進作用。事實上,組成篇章結構的語句、片段之間有着明顯的語義關系,這些關系可以加深對問題的了解[41] 。在文獻 [44-45] 中,已經證明了句法關系對閱讀了解答案抽取有促進作用,但是其性能的提升并不明顯。目前已有的基于機率和機器學習的答案抽取方法中,都是将篇章中的各個句子看作是互相沒有語義關聯的獨立資訊描述機關。但在實際上,篇章中的不同句子之間存在者緊密的邏輯語義關系,全部句子結合之後來才能完成對篇章主題的全面描述。是以,通過在篇章中逐一判别每個句子和使用者問題之間邏輯比對度的方法來選擇答案句,就無法正确回答使用者的所有問題。基于此,即有了結合篇章語義分析的閱讀了解方法,與傳統 QA 類似,該研究也得益于篇章語義分析[41,46-47]而獲得了性能的顯著提升[48] 。

繼續閱讀