天天看點

阿裡AI實作全球首個實時翻譯直播,214種語言翻譯支援今年雙11

10月21日,阿裡完成全球首個多語言實時翻譯的電商直播,該直播展示了AI無懼嘈雜環境、口音不标準及口語化語言風格等問題,實時将中文直播内容精準翻譯成英語、俄語、西班牙語等語言。阿裡方面透露,該技術将大規模應用于2020雙11。

阿裡AI實作全球首個實時翻譯直播,214種語言翻譯支援今年雙11

達摩院AI可實時翻譯直播内容及評論區的小語種語言

“語言”問題是不同地域商家和買家之間難以跨越的大山。資料顯示,速賣通上約96%的中小企業無小語種翻譯能力,而通常一個直播間就覆寫了十多個語種,82%的中國商家是以而放棄跨境直播。

盡管AI能輔助文本翻譯,但直播場景的翻譯任務更加複雜,它需要先後進行語音識别和翻譯兩個過程,并要克服口音不标準、口語化表達、直播環境嘈雜、商品專業名詞多、新品新詞更疊快等問題。例如,“然後我們的話新品大家的評價也看了”是一句口語化的句子,正确的翻譯應為“Then we have read everyone's comments on new products”,但傳統的翻譯引擎很容易錯誤地翻譯成“Then we also looked at our comments on new products”(然後我們也看了我們對新品的評價)。

為解決機器聽不清、聽不懂的問題,阿裡在業界通用方案的基礎上自研了更智能的語音模型,可在嘈雜的環境中“聽清”直播内容;同時,在AI翻譯任務過程中創新性內建了視覺資訊的識别結果,可将口語化句子改寫成正式表達句子;此外,達摩院将多領域的知識融入翻譯模型,能舉一反三,無需重新訓練便能快速學習不同場景裡不斷更疊的專業名詞。

過去幾年,阿裡AI翻譯技術曆經多次疊代更新,目前可提供214種語言的高品質翻譯,一天可翻譯3000億個詞語。并創造多項世界紀錄,曾獲2018國際機器翻譯大賽(WMT)翻譯任務5項語向冠軍,品質評估任務6項冠軍,30多項相關研究成果被國際AI頂會收錄。同時,該技術也逐漸應用于阿裡巴巴内部及外部企業客戶,日均調用量超過13億次。

達摩院機器翻譯團隊負責人駱衛華表示,“讓機器聽清、聽懂是實作精準翻譯的基礎,達摩院希望通過創新的AI算法繼續攻克電商、教育、醫療等專業領域的翻譯難題,幫助人類跨越語言障礙。”

繼續閱讀