天天看點

全球最強大腦在哪裡?阿裡小蜜算法團隊在尋找

阿裡小蜜是什麼?

阿裡小蜜是阿裡巴巴集團智能服務事業部旗下的面向電商領域的服務機器人。阿裡小蜜所在的智能服務事業部,緻力于以體驗為核心,通過人工智能算法,以資料和技術為驅動,提升使用者的服務體驗以及解決問題的效率。目前圍繞着智能對話、智能輔助、智能決策、智能管理4大核心體系通過人工智能技術全面賦能客戶,引領服務的智能化更新。在2017年,阿裡小蜜家族産品通過自然語言處理、知識圖譜、深度學習等技術引領阿裡小蜜從阿裡走向行業,從中國走向國際,圍繞這商家生态圈及阿裡雲生态圈,賦能數百萬商家和全球中小企業,覆寫了英語、俄語、葡萄牙語、西班牙語、印尼語、泰語等多個國家和地區。

全球最強大腦在哪裡?阿裡小蜜算法團隊在尋找

阿裡小蜜吉祥物

在過去的一年中,阿裡小蜜團隊已經在文本比對及遷移學習兩個方向上做了很多工作,不僅在工業界落地,真實服務消費者,而且在一些重要的國際會議上,如ACL、WSDM、CIKM等,發表了多篇論文。例如在2018的WSDM上,我們提出了一個文本比對模型的遷移學習架構,嘗試解決了同種語言下的文本比對模型的冷啟動問題。

為什麼會選擇“跨語言短文本比對算法”相關賽題?

随着人工智能時代的到來,大資料和算法成為了網際網路企業發展的兩個重要驅動力。作為人工智能重要的落地場景之一,以聊天機器人出現的智能服務系統,為企業減少大量勞動力的同時,也對提升使用者體驗具有重要意義。是以在過去幾年中,聊天機器人成為了商業公司重金投入的熱點。從微軟小冰、亞馬遜的Echo等到各種垂直行業的客服機器人,聊天機器人蓬勃發展,形态各異,又不乏共性。阿裡小蜜正是阿裡巴巴集團圍繞電商領域建構的超級個人助理,不僅可以解決使用者的各種資訊咨詢類問題,也可以幫助使用者挑選商品,為使用者訂購機票等任務。

根據應答産生的方式,聊天機器人可以分為檢索式、生成式或者混合式。在檢索式的聊天機器人中,文本比對模型是至關重要的一個子產品,決定了聊天機器人解決使用者問題的能力。文本比對模型接受一個使用者的問題,在FAQ資料集上尋找一個比對的問答對,并将人工編寫的答案回傳給使用者。為了建構一個文本比對模型,不僅需要人工收集一個稱之為FAQ(Frequently Asked Questions)的資料集,同時也需要人工标注一批使用者問題與FAQ中問答對的比對語料,用于訓練模型。然而這種情況在一些小語種中不太現實,一方面缺乏相應的标注語料,另一方面了解小語種的NLP研發人員很稀少,這兩個方面都限制了聊天機器人的研發。

全球最強大腦在哪裡?阿裡小蜜算法團隊在尋找

阿裡巴巴集團在去年開始明顯加快了國際化的程序,不僅通過速賣通(AliExpress)覆寫了俄羅斯、西班牙等120多個國家和地區,而且還在不同地區收購或投資了當地的電商企業,比如收購了東南亞地區最大的電商Lazada,在印度地區投資了Paytm等。

未來,阿裡巴巴集團将為20億使用者提供服務。在這樣一個背景下,作為阿裡集團内最大的服務團隊,在服務好國内消費者的前提下,也需要思考如何服務好國外的消費者,其中就包括使用技術手段解決消費者的服務咨詢類問題。然而,現有的技術手段需要大量的标注資料,以幫助深度學習或機器學習系統訓練出有效的模型。但一些小語種(如印尼語、泰語、菲律賓語等)不僅缺乏大規模的标注資料,而且相應的算法研發人員也相當匮乏。如何為使用這些語種的國家和地區的消費者提供高品質的服務,将是對算法人員很大的挑戰。是以我們設計了這種一個題目,希望将資料資源豐富的語言了解能力遷移到資源匮乏的語言上。

期待你的參與

通過本次比賽,我們不僅希望為學術界抛磚引玉,貢獻一個在真實場景中需要面對解決的問題,而且希望有更多的優秀選手參與比賽,共同幫助我們提升聊天機器人的能力。未來,對于消費者,他們可以自由地選擇語言,不管是使用官方語言(如英語)還是使用日常用語(如印尼語等小語種),都将得到高品質的服務。

在這項比賽中,為了使參賽人員關注于語言本身的特性及遷移能力上,我們做了一些限制,比如不要過分關注于機器翻譯技術等。這些限制,本質上是為了回歸問題本身,而不是利用外部的能力。在此之外,參賽人員可以發揮想象力和創造力,提出各種模型和解決方案。

本次大賽将向全社會開放,我們期待來自高等院校、科研機關、網際網路企業等算法工程師,在這個舞台大展身手。

原文釋出時間為:2018-06-12

本文來自雲栖社群合作夥伴“

阿裡技術

”,了解相關資訊可以關注“

”。

繼續閱讀