天天看點

神經網絡機器翻譯:進展與挑戰

作者:永大英語

感謝您關注“永大英語”!

神經網絡機器翻譯:進展與挑戰

神經網絡機器翻譯:進展與挑戰

戴光榮 劉思圻

摘要:随着全球化程序的加速和國際交流的日益密切,傳統人工翻譯方式已無法滿足迅猛增長的翻譯需求。機器翻譯以友善快捷的優勢逐漸深入人們的生活,迎來了新的發展階段。作為機器翻譯的最新範式,神經網絡機器翻譯極大地提升了翻譯的品質,有專家聲稱機器翻譯已經能夠達到“接近人工譯文”或“等同于人工譯文”的效果,進而引發了學界關于機器翻譯是否要取代人工翻譯的探讨。神經網絡機器翻譯究竟在哪些方面取得了進步?還面臨着哪些亟待解決的問題與挑戰?又該從哪些方面提升其翻譯品質?圍繞這些問題,本文簡要回顧神經網絡機器翻譯的品質提升成果,分析其面臨的問題與挑戰,多層面探讨其品質提升路徑,以期為神經網絡翻譯系統的研發提供參考借鑒。

關鍵詞:神經網絡機器翻譯;機譯品質;品質提升;機譯挑戰

1. 引言

機器翻譯(Machine Translation, MT)是指通過計算機将一種自然語言轉換為另一種自然語言的過程,涉及計算機科學、數學和語言學各領域的知識(馮志偉 2004:1)。從最初基于規則的方法,發展到基于統計的方法,再演進到神經網絡方法,機器翻譯的技術越來越成熟,極大地提高了翻譯速度和翻譯效率,翻譯品質也得到極大提升,有專家甚至聲稱神經網絡機器翻譯的品質已能夠達到“接近人工譯文”(near human parity)或“等同于人工譯文”(human parity)的效果(Hassan et al. 2018)。針對近年來品質提升而引發“機器翻譯能否取代人工翻譯”的社會探讨,有學者也表明了各自的态度(祝朝偉 2018; Pym & Torres-Simón 2021)。

機器翻譯經過幾十年的發展,已經逐漸得到人們的認可和信任。國家出台《新一代人工智能發展規劃》,将人工智能上升至國家戰略;世界正經曆“百年未有之大變局”,國與國之間頻繁持續的交流互動驅使語言服務需求激增;《2022中國翻譯及語言服務行業發展報告》顯示,語言服務企業普遍認同“機器翻譯+譯後編輯”的工作模式,機器翻譯在行業的應用越來越廣泛,機器翻譯的重要性和必要性日益彰顯。

機器翻譯包括人機共譯、人機互動、神經網絡機器翻譯(王傳英、孔新柯 2021: 75)。神經網絡機器翻譯(Neural Machine Translation)利用人工智能模仿大腦神經元進行語言翻譯,是以端到端的方式進行翻譯模組化的新一代機器翻譯方法。相較其他的機器翻譯方法,神經網絡機器翻譯有着泛化能力強、建構簡單、需要的領域專業知識少等優勢(Sutskever et al. 2014; Bentivogli et al. 2016; Toral & Sánchez-Cartagena 2017; 李沐等 2018)。然而,神經網絡機器翻譯也并非完美,還存在着如長句處理不佳、跨領域适應性差、翻譯品質不穩定等問題(秦穎 2018;郭望皓等 2021),翻譯品質與人工譯文相比仍存在較大差距,要讓機器翻譯與人工翻譯比肩還有很長的路要走。鑒于此,本文分析神經網絡機器翻譯相比先前的翻譯方法所取得的進展,分析其面臨的挑戰,探讨大資料時代神經網絡機器翻譯品質提升路徑,以期為機器翻譯研究提供參考借鑒。

神經網絡機器翻譯:進展與挑戰

2. 神經網絡機器翻譯與其他機器翻譯的比較優勢

人工神經網絡(Artificial Neural Networks, ANNs)這個名字源于生物學名詞“神經元(neuron)”。人的大腦有數億個神經元,這些神經元和樹突、軸突等組合起來,就形成了生物神經網絡(Biological Neural Networks,BNNs)。神經元依靠樹突接受刺激信号,然後根據信号的強度,通過軸突将信号傳遞給其他神經元,進而使人做出反應。人工神經網絡則是模仿這樣的運作模式,從一端的神經元接受資訊刺激,将刺激傳遞到下一層神經元,每層神經元之間的連接配接附帶着不同的權重,經過層層傳遞與權重處理,最後由另一端神經元做出反應(Koehn 2020: 30-31)。神經網絡發展曆史可追溯到70多年前,但直到2016年谷歌推出GNMT(Google Neural Machine Translation)開始,神經網絡機器翻譯才逐漸被大衆所熟知。近十年來,随着翻譯語料的逐漸積累、網際網路對電子文本的大量收集以及計算機處理能力的增強,機器翻譯才得以更好地與神經網絡模型結合起來(O’Brien 2020:378)。

從曆史發展的角度來看,機器翻譯大緻分為兩類:一類是理性主義方法,即基于規則的機器翻譯(RBMT);一類是經驗主義方法,又稱基于語料庫的機器翻譯(CBMT),分為基于執行個體的機器翻譯(EBMT)、統計機器翻譯(SMT)和神經網絡機器翻譯(NMT)三大類别(李沐等 2018)。

基于規則的機器翻譯是指通過專家彙編的語言規則,采用“IF…THEN”的形式,将原文本與翻譯規則進行對照,如果原文本符合某條規則,則會輸出該規則下對應的目智語。這種方法存在彙編時間人力成本高,趕不上語言演變的速度,規則之間存在沖突,擴大覆寫面難度大等問題(李業剛等 2015;馮志偉、丁曉梅 2021)。

基于執行個體的機器翻譯利用翻譯執行個體庫與翻譯詞典,将原文本先與相似翻譯執行個體比對,再找出不同,查找翻譯詞典進行填充。這種方法對語料規模的要求高,加上系統的限制,難以充分利用執行個體,最終影響其适應性,在統計機器翻譯出現後便淡出了機器翻譯的舞台(侯強、侯瑞麗 2019:31)。

統計機器翻譯由翻譯模型和語言模型組成。翻譯模型通過雙語平行語料學習翻譯知識,語言模型通過單語語料學習目智語的語言模式,兩種模型通過對語料的學習,能夠計算出不同語言組合出現的機率,并選出機率最高的組合作為翻譯結果。統計機器翻譯無需人工編寫規則,改變了擷取翻譯知識的方法,突破了之前的瓶頸,是以在神經網絡機器翻譯出現前,它曾一度“稱霸”機器翻譯的舞台。這種方法單純依賴于統計量,能夠運用的語言知識有限,容易造成詞與詞或短語與短語之間意義雖然比對,但是連貫起來卻晦澀難懂的問題,嚴重影響了譯文的可讀性(李業剛等 2015:4)。

神經網絡機器翻譯則是由輸入層、隐藏層及輸出層組成,原文本經輸入層編碼為向量,這些向量通過隐藏層的加工,形成計算機能夠了解的特征代表,經過多次加工,計算機提取出向量在不同次元的特征,最後再經輸出層将處理好的向量轉化為目智語言(Koehn 2020; 馮志偉 2010;秦穎 2018;肖桐、朱靖波 2021)。和上述機器翻譯模型不同,神經網絡機器翻譯的模型引入長短時記憶網絡、注意力機制等方法,使得産出的譯文更加準确流暢,提升了譯文的可讀性(侯強、侯瑞麗 2019)。 由于在神經網絡中語言均以實數向量的形式出現,我們很難從語言學的角度解釋神經網絡的内部究竟發生了什麼(劉洋 2017:1147)。随着人工智能的發展,神經網絡機器翻譯呈現出可被解釋的趨勢,這一點我們将在第五節做進一步的解釋。

神經網絡機器翻譯:進展與挑戰

3. 神經網絡機器翻譯品質評價方法及品質提升成果

神經網絡機器翻譯是機器翻譯發展史上的一次飛躍,自誕生起就迅速成為機器翻譯研究的主要對象,學界與業界對其展開探讨與評價,相比其他機器翻譯方法來說,神經網絡機器翻譯在品質提升方面有其突出特征。

機器翻譯品質測評的方法主要有三種:一是以BLEU(Bilingual evaluation understudy)為代表的自動化評價方法(Sutskever et al. 2014; Jean et al. 2015);二是對機翻譯文進行錯誤歸類、打分、排序等人工評價方法(Burchardt et al. 2017; Isabelle et al. 2017);三是自動評價與人工評價相結合的半自動評價方法(Bentivogli et al. 2016; Wu et al. 2016; Castilho et al. 2017b)。不同的測評方法得出的結果有所差異,但總體來說,神經網絡機器翻譯取得了突破性的進步,無論是在準确度還是流利度上,都是目前各類機器翻譯方法中表現最好的(Toral & SánchezCartagena 2017; Popovic’ 2017),其流利度的提升要比準确度的提升更為顯著(Moorkens 2018; Van Brussel et al. 2018)。

從詞語層面看,神經網絡機器翻譯更好地處理了詞形變化、詞序調整、詞彙選擇等問題(Bentivogli et al. 2016; Toral & Sánchez-Cartagena 2017;李梅 2021),其中對詞序調整的提升最為顯著,機翻結果更靠近參考譯文(Toral & Sánchez-Cartagena 2017),其中動詞詞序的調整改善最大(Popovic’ 2017; Castilho et al. 2017b)。神經網絡翻譯在詞形變化上也取得了很大的進步,能更好地處理主謂一緻問題(Isabelle et al. 2017),翻譯詞彙形态豐富的語言時能産出更加流利的譯文(Klubicˇka et al. 2017)。

從句子層面看,神經網絡機器翻譯能處理好句法功能及句型之間的轉換,語言更加自然流暢(Isabelle et al. 2017;肖維青、高佳晖 2020;李梅 2021)。主要原因在于神經網絡機器翻譯采用“整入整出”的政策,克服過去統計機器翻譯以詞語(短語)為翻譯機關、詞語(短語)之間關系割裂的缺陷,進而使得句子的可讀性更高(秦穎 2018)。

從語篇層面看,神經網絡機器翻譯在連貫性、銜接性等方面都取得了較大進展(Zhang et al. 2020),如使用額外的上下文編碼器(Wang et al. 2017; Voita et al. 2018; Ma et al. 2020)、感覺上下文的解碼器(Maruf & Haffari 2018; Zhang et al. 2018 )、拓展翻譯機關(Tiedemann & Scherrer 2017; Scherrer et al. 2019)等。

此外,神經網絡機器翻譯對于非語言資訊的處理也有了突破性的發展,可根據語境适當增減或轉換标點符号(Avramidis et al. 2019; 肖維青、高佳晖 2020),還有學者設計出能夠減少标點符号錯誤的ASR模型并運用于神經網絡機器翻譯(Ding et al. 2021)。由于标點符号的增減涉及到語義分析等更加複雜的問題,目前還離不開譯後編輯的輔助。

神經網絡機器翻譯:進展與挑戰

4. 神經網絡機器翻譯品質提升面臨的挑戰

盡管神經網絡機器翻譯的品質突飛猛進,在準确度和流利度上均有顯著提升,但仍然會産出一些讓人摸不着頭腦的譯文。神經網絡機器翻譯面臨的挑戰來自多方面、多領域,篇幅所限,不便全面展開,主要就罕見詞/集外詞翻譯、長句翻譯和漏譯這三個突出的問題展開探讨。

4.1 罕見詞/集外詞翻譯

在詞彙層面,神經網絡機器翻譯比較突出的是罕見詞的翻譯問題。由于神經網絡機器翻譯訓練的複雜度會随着詞彙表的數量劇增,其詞彙表的容量一般較小,通常在3萬至8萬之間(侯強、侯瑞麗 2021:56)。現實翻譯活動涉及的詞彙靈活多變,人名、地名、機構名等命名實體頻現,加上網際網路時代語言更新速度快,神經網絡機器翻譯在運作時不可避免會碰到一些罕見詞(rare word),又稱集外詞(out-of-vocabulary word),影響其翻譯的品質。

例(1)是來自四大線上機器翻譯系統(2022-0308測試)對帶有罕見詞的句子的翻譯。

(1)原文:Metaverse NFTs are unique digital items where the ownership and other information is coded into the token.

DeepL翻譯:Metaverse NFTs是獨特的數字項目,其所有權和其他資訊被編碼到代币中。

百度翻譯:Metaverse NFT是唯一的數字項目,所有權和其他資訊被編碼到令牌中。

有道翻譯:元域nft是獨特的數字項目,其中所有權和其他資訊被編碼到令牌中。

谷歌翻譯:元界 NFT 是獨特的數字物品,所有權和其他資訊被編碼到令牌中。

例(1)中,“metaverse”源于“meta(元,本質)”+ “verse(宇宙)”,也就是所謂的“元宇宙”。“元宇宙”指的是“利用科技手段進行連結與創造的,與現實世界映射與互動的虛拟世界,具備新型社會體系的數字生活空間”①,在2021年受到廣泛關注與讨論,成為年度熱詞之一。“NFT(non-fungible token)”即非同質化代币,是元宇宙下誕生的數字貨币。四大線上機器翻譯系統均沒有正确翻譯出這兩個罕見詞的意思,其中,兩大翻譯系統直接複制了源語言,另兩大翻譯系統隻對部分罕見詞進行了翻譯,且沒有翻譯準确。可見目前罕見詞問題在神經網絡機器翻譯系統中仍然比較突出。

為解決這個問題,學界嘗試過各種方法,如Luong et al. (2015)采用定位法,在翻譯模型訓練階段對資料中的罕見詞的位置進行标注,在翻譯結束後,通過查詞典或查找對應的翻譯來輸出帶有定位資訊的罕見詞;Gulcehre et al. (2016)基于命名實體等罕見詞在現實翻譯中是直接從源語言複制過來的現象,将集外詞對應的源語言詞語替換過來作為目智語;Sennrich et al. (2016)通過拆解原有單詞,将詞表壓縮成有限規模的子詞單元;Luong & Manning(2016)融合字和詞兩個級别的神經網絡翻譯模型,同時解決了源語言和目智語中的集外詞問題。

4.2 長句翻譯

長句一直以來都是神經網絡機器翻譯品質提升的難點之一。多項研究顯示(Bentivogli et al. 2016; Toral & Sánchez-Cartagena 2017;Koehn & Knowles 2017;Toral & Way 2018),随着句子增長到一定的字數,神經網絡機器翻譯的品質會快速下降;相比之下,統計機器翻譯的表現更為穩定。在一定門檻值内,神經網絡機器翻譯對長句的翻譯表現優于統計機器翻譯,品質有着顯著提升。如Toral Sánchez-Cartagena(2017)發現,句長超過40字時,基于短語的機器翻譯準确率才會超過神經網絡翻譯,而在Koehn & Knowles(2017)的研究中,這個數字為60。Popovic' (2017)并沒有發現基于短語的機器翻譯在處理長句時存在顯著優勢;Van Brussel et al. (2018)的研究認為,神經網絡機器翻譯在40字及以上的長句的翻譯表現仍是最好的。

由于這些研究選擇的語言對、翻譯方向、翻譯文本類型等要素均不同,得出的結論也有所差異。為直覺展示神經網絡機器翻譯中的長句問題,我們抽取一句來自新聞語料的長句并在四大線上機器翻譯系統(2022-03-15測試)進行測試,見例(2):

(2)原文:And there were many, many “Smiths” among them, including a historically famous fellow named John Smith, the leader of Jamestown Colony, the first English settlement in North America.

DeepL翻譯:其中有很多很多“史密斯”,包括曆史上著名的約翰-史密斯,他是詹姆斯敦殖民地的上司人,也是英國在北美的第一個定居點。

百度翻譯:他們當中有很多很多“史密斯”,包括曆史上著名的約翰·史密斯,詹姆斯敦殖民地的領袖,這是北美第一個英國殖民地。

有道翻譯:其中有很多很多“史密斯”,包括曆史上著名的約翰·史密斯,他是英國在北美的第一個殖民地——詹姆斯敦殖民地的領袖。

谷歌翻譯:其中有很多很多“史密斯”,其中包括一位曆史上著名的約翰史密斯,他是北美第一個英國殖民地詹姆斯敦殖民地的上司人。

原文中,the leader of Jamestown Colony所修飾的是John Smith,而the first English settlement in North America修飾的是Jamestown Colony。四大機器翻譯系統中,DeepL翻譯指代錯誤,将“the leader of Jamestown Colony”和“the first English settlement in North America”都識别成了John Smith的修飾語;百度機器翻譯指代模糊,“這”究竟是指前面的“殖民地”還是“領袖”,會讓讀者困惑。不過,我們也看到,有道與谷歌兩系統提供了正确的翻譯,有道機器翻譯甚至利用破折号靈活處理了原文中的插入語,這一點與上文第三部分中提到的“神經網絡機器翻譯可以根據情況适當增減或轉換标點符号”相呼應。

目前,處理長句翻譯問題的方法主要有兩種: 一是将長句切分成分句片段,再将片段翻譯結果進行組合;二是通過添加外部記憶等方式增加神經機器翻譯表達能力(李亞超等2018)。盡管這些方法取得了一定的成效,但是從現實的機器翻譯實踐以及上述案例來看,機器翻譯在處理長句上還有很大的提升空間。

4.3 漏譯的明顯性

漏譯的明顯性(the visibility of the omission error)是指“隻閱讀譯文的時候對漏譯錯誤出現的預期,即從單語角度去讀譯文時漏譯的明顯程度” (Van Brussel et al. 2018: 3802)。盡管神經網絡機器翻譯産出的譯文流暢度高,但随之而來“甯順而不信”的問題也讓人摸不着頭腦,如果不對照原文進行分析,機翻譯文的錯誤很難識别出來(Castilho et al. 2017a; Castilho et al. 2017b;Moorkens 2018;Ustaszewski 2019)。過去基于規則和基于短語的機器翻譯譯文,漏譯錯誤往往出現在不流利處。隻要讀到不通順的譯文,就可猜想這裡可能是機器漏譯了原文中的一些内容。而神經網絡機器翻譯,漏譯錯誤的特點發生了變化,單讀譯文,讀者不一定能發現有遺漏之處。

例(3)直覺地展示了這個問題(2022-03-23測試):

(3)原文:Folds of scarlet drapery shut in my view to the right hand; to the left were the clear panes of glass, protecting, but not separating me from the drear November day.

DeepL翻譯:猩紅的窗簾褶皺擋住了我的視線;左邊是透明的玻璃窗,保護着我,但并沒有将我與十一月的沉悶天氣分開。

我們将原文與機翻譯文進行對照,很容易就可以看出這裡漏譯了“to the right hand”,也就是“在右邊”。如果隻讀譯文,不看原文,“猩紅的窗簾褶皺擋住了我的視線”似乎并沒有什麼問題,讀起來也很通順,這就是所謂的“漏譯的明顯性”。在神經網絡機器翻譯中,漏譯的問題,對譯後編輯和單語翻譯品質評估帶來了很大的挑戰。盡管由于神經網絡模型的不可解釋性,我們暫時很難弄清楚漏譯的錯誤究竟是如何産生的,但也有研究者設計出一些解決機器翻譯漏譯的方法,如Wu et al. (2016)通過集束搜尋(Beam Search),擴大了模型的覆寫率,促使機器輸出最有可能涵蓋所有輸入内容的譯文;Yang et al. (2019)采用對比學習方法,将真實正确的譯文集合作為正樣例,再通過算法自動将真實譯文中的部分詞删掉,形成有漏譯錯誤的譯文集合作為負樣例,在訓練階段将它們進行對比學習,使得模型為正樣例配置設定更高的比率,為負樣例配置設定更低的比率,以有效減少神經網絡機器翻譯的漏譯錯誤。

神經網絡機器翻譯:進展與挑戰

5. 神經網絡機器翻譯品質提升的路徑

近年來,國際上每年都會舉辦如WMT(Workshop on Machine Translation)、IWSLT(International Workshop on Spoken Language Translation)等世界機器翻譯大賽,以展現機器翻譯發展的最新成果,探讨提升機器翻譯品質的方法。在日漸開放與包容的研究環境下,越來越多開源軟體供人們進一步探索機器翻譯的品質提升。神經網絡機器翻譯所面臨的問題,亟需學界展開研究,全方位探讨品質提升路徑。

5.1 綜合機器翻譯不同模式與方法的優勢

盡管神經網絡機器翻譯是目前最先進的機器翻譯方法,但與傳統的機器翻譯方法相比仍存在着不足之處,如受語料規模、品質制約嚴重,不受文法規則指導,對硬體要求高等問題(侯強、侯瑞麗 2019)。Koehn & Knowles(2017)提出神經網絡機器翻譯在處理高資源語言對時優于統計機器翻譯,但是在處理低資源語言對時表現較差;Popovic '(2017)對神經網絡機器翻譯和基于短語的機器翻譯中出現的翻譯問題進行了對比,發現兩者突出的翻譯問題各有不同,優勢互補。這些研究表明,若将不同機器翻譯模式的優勢組合起來,翻譯結果會更加優化。

近年來,有學者着手探索結合不同機器翻譯模式及方法的優勢,訓練神經網絡模型并取得一定的成效。Niehues et al. (2016)提出将基于短語的機器翻譯産出的預翻譯文本及源語言都作為神經網絡機器翻譯的輸入素材;Marie & Fujita(2018)結合統計機器翻譯和神經網絡機器翻譯各自的特點設計出一套重排序系統,能根據兩個機器翻譯模型n-best清單産出最佳的譯文;Zhang et al. (2020)通過基于短語的強制解碼方式,對神經網絡機器翻譯n-best清單進行重排序。盡管這些方法都取得了一定的成效,但也存在一些問題,如經過統計機器翻譯的預翻譯文本品質無法保證,翻譯模型是否能提高低資源語言對的翻譯品質尚未得到驗證等。将不同系統的優勢結合起來仍然是一個好的發展思路,需要學界繼續探索效果更優的結合路徑。

5.2 人機互動

人機互動是指“通過人的能力和機器能力的互動完成項目協作,知識庫共建和機器學習”(肖鳳華、殷白恩 2019: 39)。盡管神經網絡機器翻譯看似涉及的都是“高深莫測”的計算機内部的運算,人連腦子都不需要動,隻需輕點滑鼠就能得到想要的譯本,實際上這樣的操作離不開人類與其進行互動。

首先從項目協作上看,人機互動的表現形式為“基于大資料、人工智能和移動網際網路,将機器智慧與人工結合,平衡機譯高效率與人譯高品質”(肖鳳華、殷白恩 2019:38)。這種模式下,機器翻譯能夠節省人類的時間與成本,人類又能提升機器翻譯的産出品質,做到優勢互補。近年來,翻譯學界與業界都對這種新興的人機互動模式進行了探索,如崔啟亮、雷學發(2016)從人助機譯、機助人譯和翻譯系統的自我學習三個方面提出了基于人機互動的翻譯政策;季春元等(2019)基于人機互動的理念,通過建構專家語義資料庫等方法研發出一款網絡化智能翻譯系統,成功提高了機器翻譯的可靠性和智能性; Huang et al. (2021)研發出的互動式機器翻譯軟體能根據使用者輸入的内容實時更新譯文,通過學習使用者翻譯習慣和翻譯曆史智能推薦譯文。

其次從知識庫共建層面來看,人機互動表現在譯者為神經網絡機器翻譯提供高品質的語料,為品質評估提供有價值的參考譯文,針對機器翻譯譯文提出建設性評價意見等。Way(2013)指出,現在是機器翻譯的時代,隻有機器翻譯的開發者與人工譯者密切合作,機器翻譯才能取得長足發展。目前,神經網絡機器翻譯面臨着資料稀疏,尤其是低資源語料匮乏的問題,這需要譯者為機器翻譯資料訓練提供更多的高品質垂直領域平行語料,以保證機器能對語言現象和翻譯模式進行全面深度學習。

最後從機器學習層面來看,人機互動主要表現在将先驗知識融入模組化過程、利用先驗知識增加機器翻譯的可解釋性。融合先驗知識的方法包括融合單語語料、雙語詞典、語言學知識等(李亞超等 2018: 2738)。一方面,Zhang et al. (2017)基于後驗正則化設計出将先驗知識融入神經網絡機器翻譯的架構;Niehues Cho(2017)通過多任務學習将标注語言特征的資料融入機器翻譯模型中,這些融合先驗知識的方法提升了神經網絡機器翻譯的品質,優化了翻譯模型。另一方面,可解釋性一直是神經網絡機器翻譯發展的一個痛點,它涉及到對未知科學知識的挖掘、提升機器翻譯系統的可靠性、避免算法歧視等問題(Zhang et al. 2021:727-728)。Shi et al. (2016)對字元串進行訓練,進而提取神經網絡機器翻譯中部分句法資訊;Bau et al. (2018)利用無監督學習方法發現神經元中包含的語言資訊。在未來,我們有望打開神經網絡機器翻譯這一“黑匣子”,通過先驗知識,尤其是語言學知識來解釋神經網絡的翻譯過程,進而改進翻譯模型,提升翻譯品質。

神經網絡機器翻譯:進展與挑戰

6. 展望

作為機器翻譯的最新進展,神經網絡機器翻譯成果斐然,但還存在很大的發展空間。随着人工智能滲透到我們生活的方方面面,人類對機器翻譯的需求日益增加,機器翻譯的使用場景也會越來越廣泛。在這樣的背景下,提升神經網絡機器翻譯的品質顯得尤為重要,這需要各個領域的專家交流合作,共同朝着這一人工智能的終極目标邁進。正如Koehn(2020:13)所說,機器翻譯研究要破解的“魔咒”不是要達到完美的翻譯,而是降低錯誤率。我們追求的目标不是讓機器翻譯取代人工翻譯,而是利用它在最大程度上便利人類的翻譯活動,讓機器翻譯成為一種生産力,助力國家經濟發展與社會進步。

(參考文獻 略)

(本文首次發表在《外語教學》2023年第1期)

神經網絡機器翻譯:進展與挑戰

繼續閱讀