基于外賣評論的輿情風控

2019-12-10 23:50:00

業務背景

目前許多商家都有線上留言或者評論回報平台，消費者可以在這些平台上通過留言表達自己對于消費商品的回報。消費者的回報包括表揚性的正向回報，也有一些批評性質的負向回報。商家需要掌握消費者對于産品的整體輿論取向來判斷自己的産品品質是否符合消費者需求，同時了解評論内容可以友善商家分析輿論導向，指導下一步産品研發工作。

業務痛點

目前許多酒店、餐飲、零售的留言平台每天都有大量的留言産生，傳統的輿論情緒收集方案是通過人工統計的方式，但是這種方式較為低效，很難針對大規模的輿論做出精确統計。需要自動化的手段收集并判斷留言平台的輿論走向。

解決方案

PAI平台提供了一套基于文本向量化以及分類的算法，可以基于曆史标記的正負留言内容生成分類模型，自動對平台上的新增留言進行預測。該服務的整體架構已經基于PAI-Studio開發完成，基于真實的打标後的11987條外賣平台評論資料，實作了自動化的正反面輿論風控，準确性達到75%左右。

1.人力要求：需要具備基礎的NLP及分類算法知識用于模型調試

2.開發周期：1-2天

3.資料要求：最好有超過千條的打标資料，資料越多效果越好

資料說明

參數名稱	參數描述
label	标簽，1是正向評論，0為負面評論
review	實際評論資料

流程說明

進入PAI-Studio産品：

https://pai.data.aliyun.com/console

該方案資料和實驗環境已經内置于首頁模闆：

打開實驗：

1.資料源

上文提到的評論資料

2.停用詞

過濾一些助動詞以及标點符号，需要自己上傳停用詞表

3.文本向量化

利用Doc2vector算法把每個評論變成語意向量，每行是一個向量，每個向量代表一個評論的含義

4.生成分類模型

将向量化後的文本通過拆分算法拆分為訓練集以及測試集，訓練集通過邏輯回歸算法訓練生成二分類模型，該模型可以實作對于評論是正向評論或者負向評論的判斷。

5.模型效果驗證

通過混淆矩陣算法驗證模型的實際效果，

總結

本文提到的基于留言評論的輿情風控方案可以用PAI元件在1-2天時間内非常快速的實作，實作後可以批量的對于平台上面的留言輿論進行智能化分析，并且随着資料的累計，模型的準确性會逐漸增強。該方案适用用各種基于文本場景的分析，比如垃圾郵件分類、新聞正反情緒分類等。

基于外賣評論的輿情風控

業務背景

業務痛點

解決方案

資料說明

流程說明

總結

繼續閱讀

查找算法學習之二分查找（Python版本）——BinarySearch

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

【python】【資料處理】畫多元資料分布圖

hdu7108哈希