天天看點

怎麼用python電商文本挖掘?(3)

以驅蟲市場資料為例,挖掘某店鋪新的業務方向和市場增長點。

聯系微信sinoleadgolf

接上一節(2) 滅鼠 這個産品類别 是好的選擇,那麼細分來看滅鼠産品什麼屬性比較受市場歡迎。

7.子類别 - 滅鼠 分析

選擇滅鼠資料

怎麼用python電商文本挖掘?(3)

對其價格進行描述統計

怎麼用python電商文本挖掘?(3)

現準備找到 銷量比較好的價格區間 分箱化操作

根據業務邏輯 自定義區間 分箱化處理

bins = [0,50,100,150,200,250,300,500]
labels = ['0-50','50-100','100-150','150-200','200-250','250-300','300+']
df24['價格區間'] = pd.cut(df24['售價'],bins,labels=labels,include_lowest=True)
df24['價格區間'].value_counts()
           
怎麼用python電商文本挖掘?(3)

根據業務邏輯,我們要計算:

各價格區間的銷售額,銷售額占比,寶貝數,競争度(單寶貝平均銷售額的反面)

df24.groupby('價格區間').sum()
a=df24.groupby('價格區間').sum().loc[:,['預估銷售額']]
b=df24.groupby('價格區間').nunique()['寶貝ID']
a['寶貝數']=b
a['銷售額占比'] = a['預估銷售額']/a['預估銷售額'].sum()
a['單寶貝平均銷售額'] = a['預估銷售額']/a['寶貝數']
a['相對競争度'] = 1 - (a['單寶貝平均銷售額']-a['單寶貝平均銷售額'].min())/(a['單寶貝平均銷售額'].max()-a['單寶貝平均銷售額'].min())
a
           

然後我們形成這樣一張表

怎麼用python電商文本挖掘?(3)

銷售額占比 好比 市場中的海,值越大 海越大

相對競争度 是通過 對 單寶貝平均銷售額 标準化得來的,值越小 越‘藍’。

單寶貝平均銷售額 是 在價格區間的 銷售額除以寶貝數量 衡量 競争程度。

byprice1 = byfun(df24,'價格區間')
def mcplot(bydf,figsize=(10,4)):
    ax = bydf.plot(y='相對競争度',linestyle='-',marker='o',figsize=figsize)
    bydf.plot(y='銷售額占比',kind='bar',alpha=0.8,color='wheat',ax=ax)
    plt.show()
 mcplot(byprice1)
           
怎麼用python電商文本挖掘?(3)

結果依單寶貝銷售額降序,即依競争度升序可見0-50容量大,競争大,大容量市場(對比的是50-100,容量小,競争稍小)200-250,競争小,做高價市場的優先選擇,屬于機會點。

8.找到細分市場價格區間後 進一步價格細分分析

df25 = df24[df24['價格區間']=='0-50']
df25['售價'].plot.hist()
           
怎麼用python電商文本挖掘?(3)
bins1 = [0,10,20,30,40,50]
labels1 = ['0_10','10_20','20_30','30_40','40_50']
df25['價格子區間'] = pd.cut(df25['售價'],bins1,labels=labels1,include_lowest=True)
byprice2 = byfun(df25,'價格子區間')
byprice2
mcplot(byprice2)
           
怎麼用python電商文本挖掘?(3)

可見10-20競争度低,容量大,優選,20-30也不錯200-250細分市場也是同樣的分析思路.

9.細分市場 商品屬性分析

店鋪類型:

怎麼用python電商文本挖掘?(3)

可見天貓産品銷售額和相對競争度都優于淘寶

型号:

怎麼用python電商文本挖掘?(3)

可見雖然粘鼠闆市場佔有率普遍較高,但是0005在競争度上有明顯的優勢

實體形态:

怎麼用python電商文本挖掘?(3)

可見市場佔有率最高的是固體,競争度也偏高,而膠水雖然競争度低,但是市場佔有率較低基本可以認為常見的實體形态就是固體。

淨含量:

怎麼用python電商文本挖掘?(3)

可見當實體形态為固體,淨含量為1時,潛力較大.