天天看點

機器翻譯在跨境電商中的應用和實踐

什麼是機器翻譯

機器翻譯,是利用計算機将一種自然語言(源語言)轉換為另一種自然語言(目智語言)的過程。機器翻譯的的實用價值随着經濟全球化及網際網路的飛速發展而日益提高,在促進政治、經濟、文化交流等方面起到越來越重要的作用。

機器翻譯的應用面很廣。比如:

  • 為語言服務公司提供翻譯服務
  • 幫助政府國企在内容、新聞、服務上多語言化
  • 在網際網路上擷取國際新聞資訊,使用Facebook、Twitter等海外平台
  • 協助跨國公司的業務開展
  • 為工具類服務提供商做内容展現

    ... ...

據統計,機器翻譯市場規模在17年已達450億,并以每年10%的增率持續增長。機器翻譯每天線上翻譯量可達1000億次,需求量龐大,尤其是在跨境業務指數增長以後,對資訊互通的專業要求讓機器翻譯成為了當下比較火熱的使用工具。

阿裡巴巴.機器翻譯

機器翻譯

是阿裡于2011年開始啟動研發的語言服務項目,目标是打造一個全球領先的電子商務機器翻譯引擎,為集團的多語言業務提供基礎的多語言技術基礎設施。

阿裡巴巴集團内部的跨境貿易中涉及了海量的跨語言問題,從成本、效率和實時性來講,海量的資訊如果單純依賴人工翻譯完全無法滿足需求,在這樣的背景下,機器翻譯顯得尤為重要。

機器翻譯在跨境電商中的應用和實踐

阿裡巴巴機器翻譯在整個電商完整鍊路上都提供了優質的服務能力。包括:SEO(搜尋引擎優化)、搜尋、商品标題、商品詳情(類目/屬性/描述)、商品評論、實時溝通、稽核風控等電商基礎資料領域,都能提供全面的實時翻譯服務能力,解決各個國家使用者對資訊的基本閱讀需求。

阿裡巴巴機器翻譯每天能夠提供近十億級的線上翻譯服務,每秒提供上萬QPS(每秒查詢率)的語句翻譯能力。經過多年的沉澱,依托領先的自然語言處理技術和海量的網際網路資料優勢,阿裡巴巴成功上線基于注意力機制的深層神經網絡翻譯系統(NMT),幫助使用者跨越語言鴻溝,暢享交流和擷取資訊,實作無障礙溝通,憑借其海量資料積累及關鍵技術創新,在電商領域翻譯品質獨具優勢。

機器翻譯在跨境電商中的應用和實踐

目前,阿裡巴巴機器翻譯提供阿拉伯語、俄語、法語、葡萄牙語、泰語、土耳其語、西班牙語、越南語、印尼語、英語和中文的自動語種識别和翻譯服務,支援通用場景和電商垂直場景兩大類場景,通用場景支援中英互譯,電商場景支援電商完整鍊路的各項基礎資料領域,具體包括:

  • 标題翻譯支援英語到阿語、俄語、法語、葡語、泰語、土語、西語、越南語、印尼語、中文等語種的翻譯
  • 商品描述支援英語到阿語、俄語、法語、葡語、泰語、土語、西語、越南語、印尼語、中文等語種的翻譯
  • 商品評論或買賣家溝通等支援英語到阿語、俄語、法語、泰語、土語、西語、越南語、印尼語、中文等語種的互譯
  • 可聯系官網,溝通定制化版本事宜

應用案例

多語言搜尋

對于跨境電商網站而言,為每個國家的使用者建立一套搜尋引擎,成本是很大的。阿裡巴巴通過統一采用基于英文的索引,将最終的使用者搜尋詞轉化成為英文,再根據英文的索引去檢索使用者所需的商品資訊,如此就可以實作多語言搜尋了。

如下圖示,AliExpress的俄羅斯使用者用俄語搜尋了“麥克風”,智能語種識别出使用者所用語言是俄語,之後調用拼寫糾錯功能。調用該功能是因為在使用者輸入檢索詞中,很有可能出現個别單詞的錯誤,是以就需要智能拼寫糾錯功能将個别拼寫錯誤的詞糾正過來,機器翻譯再翻譯成英文版本,最後調用搜尋引擎,拿到使用者想要的商品資訊。這樣,一條提升使用者從List到Detail轉化率的鍊路就打通了。

機器翻譯在跨境電商中的應用和實踐

商品資訊多語言化

使用者來到商品詳情頁後,會通過網站的導航找到自己想要的類目,再找到想要的商品。

使用者在看過商品标題後,往往會再看商品較長的描述,一些使用者還會看看商品評論。當使用者浏覽商品網頁時,必須能讀懂、了解網頁内容,如果使用者不能了解,那麼很有可能這個使用者就流失了。是以,做跨境電商十分需要将商品資訊實作多語言化,讓使用者讀懂和了解這個商品究竟賣什麼?它的功能又是什麼?

機器翻譯在跨境電商中的應用和實踐

下圖展現的是阿裡巴巴速賣通場景下對标題部分做的工作。我們可以看到,商品屬于英文的原發商品,而通過翻譯可以将其翻譯成為不同國家的語言。在下圖中,同樣的一條裙子的标題除了英文之外,還被翻譯成了俄語和阿拉伯語兩個版本。

機器翻譯在跨境電商中的應用和實踐

針對商品評論而言,阿裡巴巴實作對同一商品不同語言釋出的評論進行互相翻譯。在下圖中,就是将西語原發的評論翻譯成了俄語和阿拉伯語,這樣一來,使用者就可以參考産品的買家體驗,來增加對該産品的判斷。

機器翻譯在跨境電商中的應用和實踐

在阿裡速賣通中,一般而言,商家釋出版本基本上都以英文為主。由此,機器翻譯就需要将英文原發的商品較長的描述,比如商品尺寸、品質屬性以及物流資訊等都翻譯成其他語言的版本。

機器翻譯在跨境電商中的應用和實踐

最後,另一個使用者使用比較多的功能,就是“問大家”。在速賣通,針對于“問大家”這個功能,需要将不同國家、不同語言使用者所提出的問題都翻譯成多個語言的版本,進而讓更多的人能夠得到自己所需要的資訊,在下圖中,就是将俄文的問題翻譯成英文和阿拉伯語的場景。

機器翻譯在跨境電商中的應用和實踐

通關翻譯

在跨境電商場景中,商品物流有一個必須步驟,就是商品通關。在下圖中,商品是一個手機支架,但它的英文名非常長,而海關可能隻希望拿到商品的關鍵資訊。這時,NLP智能品名生成技術就會從一長串的标題裡抽取出關鍵詞,如圖示就抽出了“Phone Holder”關鍵詞,再把這個關鍵詞通過機器翻譯轉成中文的“手機支架”,由此海關便能迅速獲知該商品的資訊,高效便捷地完成産品的通關過程。

機器翻譯在跨境電商中的應用和實踐

多語言實時溝通

在跨境電商貿易中,交易前後往往都有買家和賣家間的溝通。在阿裡巴巴的調研中發現,其實在國際貿易中的買家中的30%是使用小語種的,而大部分買家卻往往缺少小語種的溝通服務能力。

是以,阿裡巴巴開發了一套針對于多語言實時溝通場景的自動翻譯系統。在電商場景中,首先,支援多語種之間的互譯,憑借背後規模龐大的雙語術語庫,其對術語的翻譯是非常準确的。

其次,具有智能處理能力,可以根據使用者的場景自動地識别其使用的語種,再根據使用者所使用的語種進行自動翻譯,并且提供基于上下文的智能糾錯,還針對口語場景做了表述歸一化的統一處理。

最後,多語言實時溝通系統還實作了跨境多語言溝通方案,這套方案支援多端包括PC、IOS、Android,能夠實作多語言資訊的實時溝通,使用者可以基于機器翻譯或者譯文進行編輯。如果使用者具有相應的語言能力,可以根據機器翻譯的結果在發送前進行編輯。在很多場景下,也需要對于特定的術語進行快速幹預,将其翻譯成想要翻譯的文本,是以在這樣實時工作的場景下,也是具備支援實時幹預的能力。

機器翻譯在跨境電商中的應用和實踐

有想法,想讨論?歡迎加入資料智能交流群。

一:釘釘搜尋數字進入交流群:23116044

二:釘釘掃描二維碼進交流群:

機器翻譯在跨境電商中的應用和實踐

繼續閱讀