天天看點

人工智能在領英上即時翻譯5000年前的楔形文字翻譯并不是簡單地把一個單詞換成另一種語言中相應的單詞。高品質的翻譯要求譯者

作者:CashewHealth

人工智能在領英上即時翻譯5000年前的楔形文字

翻譯并不是簡單地把一個單詞換成另一種語言中相應的單詞。高品質的翻譯要求譯者了解兩種語言是如何将思想聯系在一起的,然後利用這些知識來創造一種保持原文語言細微差别的翻譯,讓母語人士毫不費力地了解。

盡管這個過程很困難,但與将一種古老的語言翻譯成現代語言的挑戰相比,這根本不算什麼。翻譯人員不僅要從書面資料中複活已經滅絕的語言,還要對産生這些資料的文化如何經過幾個世紀的演變有深入的了解。正因為如此,能夠翻譯古代語言的人很少,他們的最大努力往往被考古學家發掘的大量文本所超越。

阿卡德語是阿卡德帝國的母語,阿卡德帝國在公元前2300年左右通過其創始人薩爾貢大帝的征服而興起。作為一種口語,阿卡德語最終分裂成亞述和巴比倫方言,然後在公元前一千年早期被阿拉姆語完全取代。今天,它是一種真正滅絕的語言,甚至沒有子語言來繼承它的遺産。

為了幫助改變這種情況,一個由考古學家和計算機科學家組成的多學科團隊開發了一種人工智能,它可以幾乎立即翻譯阿卡德語,并解鎖儲存在這些5000年前的石闆上的曆史記錄。

該團隊在開放豐富注釋楔形文字語料庫中的楔形文字樣本上訓練人工智能模型,并教它以兩種不同的方式翻譯。首先,人工智能模型學會了從原始文本的音譯中翻譯阿卡德語。它還學會了如何直接翻譯楔形文字。更具體地說,它翻譯了由另一個省時工具生成的楔形文字的Unicode符号,該工具可以從原始平闆電腦的圖像自動生成Unicode。

然後,人工智能模型必須弄清楚如何處理樣本中各種體裁的細微差别——例如,文學作品和行政信件之間的差異——以及如何處理幾千年來楔形文字中發現的變化。然後使用BLEU4對人工智能模型進行測試,BLEU4是一種用于評估機器翻譯文本的算法。

在英語音譯測試中,該團隊的人工智能模型獲得了37.47分。在楔形文字對英語的測試中,它得了36.52分。這兩個分數都高于他們的目标基線,在高品質翻譯的範圍内。結果令人驚訝:該模型能夠重制每個測試句子體裁的細微差别。雖然這不是研究人員的目标之一,但他們在研究中指出,這可能為翻譯以外的應用開辟了可能性。

該團隊寫道:“在幾乎所有情況下,無論翻譯是否正确,這種類型都是可識别的。”“一個很有希望的未來場景是(模型)向使用者顯示他們基于翻譯的來源清單,這對學術目的也特别有用。”#人工智能行業應用#

人工智能在領英上即時翻譯5000年前的楔形文字翻譯并不是簡單地把一個單詞換成另一種語言中相應的單詞。高品質的翻譯要求譯者
人工智能在領英上即時翻譯5000年前的楔形文字翻譯并不是簡單地把一個單詞換成另一種語言中相應的單詞。高品質的翻譯要求譯者
人工智能在領英上即時翻譯5000年前的楔形文字翻譯并不是簡單地把一個單詞換成另一種語言中相應的單詞。高品質的翻譯要求譯者

繼續閱讀