業務背景
目前許多商家都有線上留言或者評論回報平台,消費者可以在這些平台上通過留言表達自己對于消費商品的回報。消費者的回報包括表揚性的正向回報,也有一些批評性質的負向回報。商家需要掌握消費者對于産品的整體輿論取向來判斷自己的産品品質是否符合消費者需求,同時了解評論内容可以友善商家分析輿論導向,指導下一步産品研發工作。
業務痛點
目前許多酒店、餐飲、零售的留言平台每天都有大量的留言産生,傳統的輿論情緒收集方案是通過人工統計的方式,但是這種方式較為低效,很難針對大規模的輿論做出精确統計。需要自動化的手段收集并判斷留言平台的輿論走向。
解決方案
PAI平台提供了一套基于文本向量化以及分類的算法,可以基于曆史标記的正負留言内容生成分類模型,自動對平台上的新增留言進行預測。該服務的整體架構已經基于PAI-Studio開發完成,基于真實的打标後的11987條外賣平台評論資料,實作了自動化的正反面輿論風控,準确性達到75%左右。
1.人力要求:需要具備基礎的NLP及分類算法知識用于模型調試
2.開發周期:1-2天
3.資料要求:最好有超過千條的打标資料,資料越多效果越好
資料說明

參數名稱 | 參數描述 |
---|---|
label | 标簽,1是正向評論,0為負面評論 |
review | 實際評論資料 |
流程說明
進入PAI-Studio産品:
https://pai.data.aliyun.com/console該方案資料和實驗環境已經内置于首頁模闆:
打開實驗:
1.資料源
上文提到的評論資料
2.停用詞
過濾一些助動詞以及标點符号,需要自己上傳停用詞表
3.文本向量化
利用Doc2vector算法把每個評論變成語意向量,每行是一個向量,每個向量代表一個評論的含義
4.生成分類模型
将向量化後的文本通過拆分算法拆分為訓練集以及測試集,訓練集通過邏輯回歸算法訓練生成二分類模型,該模型可以實作對于評論是正向評論或者負向評論的判斷。
5.模型效果驗證
通過混淆矩陣算法驗證模型的實際效果,
總結
本文提到的基于留言評論的輿情風控方案可以用PAI元件在1-2天時間内非常快速的實作,實作後可以批量的對于平台上面的留言輿論進行智能化分析,并且随着資料的累計,模型的準确性會逐漸增強。該方案适用用各種基于文本場景的分析,比如垃圾郵件分類、新聞正反情緒分類等。