天天看點

Python資料分析之商品資料分析

閱讀提示

本文将使用Python語言對市面上火爆的0卡飲料——元氣森林氣泡水多元度分析,它的味道怎麼樣?大家是如何評價它的呢?

目錄

    • 閱讀提示
    • 1、如何入手
    • 2、選擇分析對象
    • 3、明确目标
    • 4、對目标進行分解
        • “拆” 的藝術大體可以分為兩步
    • 5、資料處理
    • 6、 結果分析
    • 結語
Python資料分析之商品資料分析

提到資料分析的時候,我們可能最先想到的就是柱狀圖、餅圖,高端一點的有詞雲等等,但總有一些大佬會Diss你 :詞雲太簡單了吧,有點low

1、如何入手

在做資料分析的時候我們通常會遇到兩種情況:

1、分析不出結果歸咎于資料量不夠、次元不夠等因素

2、自己不會使用複雜的算法和構造模型來預測或分析,也沒有去思考如何通過學習來進一步的完成完成分析工作

資料次元和算法的價值當然不言而喻,但總是把分析不出結果和價值的鍋甩出去,這種歸錯于外的思維非常危險,它營造了一種“ 分析不出結果,我也沒辦法” 的心安理得。

2、選擇分析對象

這裡我将選用市面上很火的一種0卡飲料,元氣森林氣泡水來作為本次分析的對象。

Python資料分析之商品資料分析

那麼如何對該商品進行簡單且粗暴的分析呢?讓我們繼續往下進行。

3、明确目标

我們的目标是什麼?

我們想要通過這次分析得到什麼?

比如我們本次分析的要求是: 基于評價,更好的了解消費者對産品的看法。

是以 我們的最終目标就是 “基于評價回報,量化消費者感覺,指導優化産品”。

4、對目标進行分解

不知道大家有沒有聽過一種世界上最牛掰的學習方法:費曼技巧

總結一下的話就是: 用大白話去解釋新知識,然後通過這種行為加深自己的了解

“拆” 的藝術大體可以分為兩步

第一步是換位思考。

評價來源于買家,買家對産品有哪些方面的需求或者感覺呢?

第二步,基于換位的邏輯拆解

這裡可以按照模拟購物流程的邏輯來拆解:

首先,氣泡水本身有非常強的 知名度 買家或多或少是慕名而來。是以,在購買時,到底有多大比例是沖着氣泡水這個名号來的呢?

在物流,付款到收貨用了幾天?派送員态度怎麼樣,送貨上門了嗎?

收到貨後 包裝 怎麼樣。外包裝有沒有破損?有沒有變形?産品包裝是精緻還是粗糙?

接下來是 産品體驗,拿氣泡水來說,日期是否比較新?口味買家是否喜歡?到底好不好喝?0卡的噱頭到底有沒有用?

品嘗飲料之後,我們可以建立對産品的立體感覺——成本效益。花錢買這個産品到底值不值?這個價位是貴了還是便宜?實惠不實惠?

這樣,我們就将 品牌、物流、包裝、産品(日期、口味)和成本效益五大方面初步展現出來了

5、資料處理

這裡我們用一種簡單粗暴的方式,按标點把整條評論拆分成零散的子產品,再設定一系列預置詞來周遊。

首先我們檢視一下抓取到的評論:

Python資料分析之商品資料分析

根據标點符号來拆分内容

for i in df['初評内容']:
    result.append(re.split('[::,,.。!!~·`\;; ……、]',i))
           

看一下拆分後的效果

Python資料分析之商品資料分析

已經可以看到,初步對使用者的評論進行了斷句,觀察評論不難看出他們的主要内容涉及到品牌(元氣水)、物流、口味、成本效益等方面,是以這裡我們用一個笨辦法,依次去周遊内容,如果評論中沒有相關内容我們就跳過,有的話再對使用者的評論進行情感分析(喜歡或者不喜歡)

我們以口味為例來對使用者評論進行周遊:

#産品口味,共三種
if '橘子' in word or '橘' in word :
    judges.iloc[i]['橘子口味'] = 1
elif '白桃' in word or '桃子' in word or '桃' in word:
    judges.iloc[i]['白桃口味'] = 1
elif '青瓜' in word or '黃瓜' in word:
    judges.iloc[i]['青瓜口味']
           

以物流為例來對使用者評論進行周遊:

#先判斷是不是物流相關的
if '物流' in word or '快遞' in word or '配送' in word or '取貨' in word or '送貨' in word:
    #再判斷是正面還是負面
	if '好' in word or '不錯' in word or '棒' in word or '滿意' in word or '迅速' in word:
    	judges.iloc[i]['物流正面'] = 1
    elif '慢' in word or '龜速' in word or '暴力' in word or '差' in word:
        judges.iloc[i]['物流負面'] = 1

#判斷是否包裝相關
if '包裝' in word or '盒子' in word or '袋子' in word or '外觀' in word:
	if '高端' in word or '大氣' in word or '還行' in word or '完整' in word or '好' in word or '嚴實' in word or '緊' in word:
		judges.iloc[i]['包裝正面'] = 1
    elif  '破' in word or '破損' in word or '癟' in word or '簡陋' in word:
        judges.iloc[i]['包裝負面'] = 1
           

其他方面就不再一一贅述,請各位讀者根據自身情況設定合理的周遊方法。

我們運作一下,看看周遊後的效果如何:

Python資料分析之商品資料分析

第一條評論中很明顯的能看出,買家反應了物流快、價格便宜等資訊,是以我們對物流正面、成本效益正面加了一分。

第二條中買家提到了好喝,那麼就是口感方面的正面評價,也對其加一分。

第十條提到了商品ip屬性和口感方面,也追加一分。

總的來說達到了我們想要的目的!雖然代碼比較簡陋但效果還不錯!

6、 結果分析

首先我們将結果彙總在同一張表裡

Python資料分析之商品資料分析

這樣看來可能不夠明顯,我們用Tableau做個圖看看:

Python資料分析之商品資料分析

我們可以看出,口感是使用者比較關注的點,占了絕大部分的比例,相比于其他的日期、口味等等遙遙領先。

緊随其後的便是成本效益、物流了。

那不同類别 正負面評價 占比是怎麼樣的呢?

Python資料分析之商品資料分析

從整體來看,評論整體趨向于好評,其中口味(橘子、青瓜、白桃)這邊沒辦法細分,口感、成本效益、物流方面 正面評論占了絕對的主導。

那麼正面評價主要來自于哪裡呢?我們看看口感方面的正面評價:

Python資料分析之商品資料分析

初步篩選後,我們可以看到,一共給出了194次口感的正面評價,可以說這個氣泡水的口味是相當的贊了!那麼其中白桃口味占到的比例更高,最奇怪的是沒有人提到青瓜口味(說實話我挺愛喝這個青瓜口味的,比較爽口),可能是我們本次取到的樣本數不足的原因。

在成本效益方面:

Python資料分析之商品資料分析

正面評論一共提到62次,可以看出元氣森林的氣泡水從口味、口感、包括所宣傳的0卡、低熱量等方面都做的很不錯,價格也比較親民。可能因為本次分析所采集到的資料不夠全面導緻部分方向與實際有些偏差,但我們也大膽的進行分析,給出成本效益負面評價的買家很可能是對價格不夠滿意,在市面上為5-6元一瓶,部分買家可能也會有所顧忌,但鑒于大家對口感方面有99%的好評率,我們可以通過進行打折促銷活動,或者多買多送等活動來吸引這部分對價格敏感的消費者。

結語

在最後,我們展示一下部分買家的對白桃口味汽水的評價吧(這個口味是大家最喜歡的口味哦!)

Python資料分析之商品資料分析

至此,我們本次分析就告一段落了,我們采用了最簡單淺顯的方式對擷取到的評論進行了拆分,并将拆分後的字元串進行了分析、量化、可視化等操作,距離接觸到真正的資料分析又近了一步~