天天看點

Ocado客戶服務中運用了TensorFlow和Google雲平台

通過建立與google及google雲平台(gcp)的合作夥伴關系,ocado techonology公司釋出了一種新的方法,用在對ocado的50多萬使用者及來自這些使用者的海量電子郵件請求的進行中。該方法使用了tensorflow及宿主于gcp上的tensorflow python api,重點在于解決電子郵件的自動分類問題。

ocado認為對于電子郵件分類問題,非常适合于使用工業規模的機器學習和自動化,更具體的說就是自然語言處理(nlp)。很多的企業支援中心為讓工作一緻和可靠,采用了依靠從業人員手工處理電子郵件隊列的工作流程。在企業的業務迅速成長時,或是整體客戶支援量所需的支援人員日益增長時。這種方法并不能很好地擴充,這會導緻郵件響應的延遲,客戶不滿意度也随之增加。

ocado的做法是将所有的電子郵件彙集到同一處,然後通過分析郵件内容為郵件打标簽,例如标記為客戶投訴的則需要立刻回報,标記為一般性回報的則具有稍低的優先級可稍遲回報。此外,郵件标簽還包括:重發貨請求、退款請求、支付問題或網站問題、新商品查詢等。

ocado想要在配置設定标簽類别時,盡可能地減少需使用者及支援人員手工輸入的域和标簽的數量。因為這種手工輸入不僅容易産生偏差并生成噪聲資料,而且也占用了支援人員的寶貴時間,這些時間是本可用于根據客戶請求的優先度服務于客戶的。

ocado科技的進階軟體工程師marcin druzkowski今年八月在datasciencefest大會上的演講上,給出了ocado訓練神經網絡所用的各種模型的一些細節。其中的方法包括:使用詞袋的邏輯回歸、使用嵌入(embedding)的卷積神經網絡(cnn)、使用嵌入的長短期記憶模型(lstm)。

druzkowski指出深度學習并非一定要使用gpu,考慮到cpu晶片的相對低成本、雲計算的可擴充性和并行計算模型訓練,沒有必要再采用特定的gpu寫入和訓練模型。他也指出通過以軟體工程為中心的資料科學方法,他們的tensorflow圖以資料矩陣和圖定義的方式部署,這不同于資料科學軟體所使用的一般方法,那些方法已被證明在部署和易于內建到生産環節的實作上存在着挑戰。druzkowski在演講中提到的特性還包括:可移植性和依賴性管理、代碼品質、測試覆寫度、版本管理和持續內建。

圍繞着測試模型,還出現了其它的一些新挑戰。這些測試模式需給出随機性、可接受結果值範圍和良好模型性能的組成目标。此外,挑戰也存在于如何在背景資料集發生改變時,重新訓練和測試模型。在确定一個模型是否有價值時,需額外考慮的變量是資料集改變的比例和速度。目前測試的運作使用了pytest和tensorflow,但是ocado拒絕了提供示例代碼的請求。

檢視英文原文:ocado uses tensorflow and google cloud platform for novel customer service approach