天天看點

《中國人工智能學會通訊》——2.29 未來展望

綜上所述,機器翻譯研究 60 多年來的發展趨勢是不斷降低人在翻譯過程中主導作用:基于規則的方法完全靠人編纂翻譯規則;基于統計的方法能夠從資料中自動學習翻譯知識,但仍需要人來設計翻譯過程的隐結構和特征;基于深度學習的方法則可以直接用神經網絡描述整個翻譯過程。近年來,端到端神經機器翻譯成為最熱門的研究領域,未來的研究方向可能集中在以下五個方面。

● 架構:如何設計表達能力更強的新架構?近期提出的神經網絡圖靈機[15]和記憶網絡[16]可能成為下一個關鍵技術。

● 訓練:如何降低訓練複雜度?如何更有效地提高翻譯品質?近期的工作表明直接優化評價名額能夠顯著提升翻譯性能[17-18] 。

● 先驗知識:目前的方法完全從資料中自動學習翻譯知識,能否利用先驗知識指導翻譯過程?能否與現有的知識庫相結合?近期在基于注意力的翻譯模型上的研究工作已經有一些初步進展[19] 。

● 多語言:目前的方法主要進行中文和英文等資源豐富語言,能否處理更多的語言對? Bengio研究組提出的基于共享注意力機制的多語言翻譯方法值得關注[20] 。

● 多模态:目前的方法主要關注文本翻譯,能否利用向量表示貫通文本、語音和圖像,實作多模态翻譯?最近在圖像标題翻譯上的研究工作是很好的嘗試[21] 。

相信未來幾年,基于深度學習的機器翻譯方法尤其是端到端神經機器翻譯會取得更大突破,發展成為新時期機器翻譯的主流技術,造福于社會大衆。

繼續閱讀