天天看点

怎么用python电商文本挖掘?(3)

以驱虫市场数据为例,挖掘某店铺新的业务方向和市场增长点。

联系微信sinoleadgolf

接上一节(2) 灭鼠 这个产品类别 是好的选择,那么细分来看灭鼠产品什么属性比较受市场欢迎。

7.子类别 - 灭鼠 分析

选择灭鼠数据

怎么用python电商文本挖掘?(3)

对其价格进行描述统计

怎么用python电商文本挖掘?(3)

现准备找到 销量比较好的价格区间 分箱化操作

根据业务逻辑 自定义区间 分箱化处理

bins = [0,50,100,150,200,250,300,500]
labels = ['0-50','50-100','100-150','150-200','200-250','250-300','300+']
df24['价格区间'] = pd.cut(df24['售价'],bins,labels=labels,include_lowest=True)
df24['价格区间'].value_counts()
           
怎么用python电商文本挖掘?(3)

根据业务逻辑,我们要计算:

各价格区间的销售额,销售额占比,宝贝数,竞争度(单宝贝平均销售额的反面)

df24.groupby('价格区间').sum()
a=df24.groupby('价格区间').sum().loc[:,['预估销售额']]
b=df24.groupby('价格区间').nunique()['宝贝ID']
a['宝贝数']=b
a['销售额占比'] = a['预估销售额']/a['预估销售额'].sum()
a['单宝贝平均销售额'] = a['预估销售额']/a['宝贝数']
a['相对竞争度'] = 1 - (a['单宝贝平均销售额']-a['单宝贝平均销售额'].min())/(a['单宝贝平均销售额'].max()-a['单宝贝平均销售额'].min())
a
           

然后我们形成这样一张表

怎么用python电商文本挖掘?(3)

销售额占比 好比 市场中的海,值越大 海越大

相对竞争度 是通过 对 单宝贝平均销售额 标准化得来的,值越小 越‘蓝’。

单宝贝平均销售额 是 在价格区间的 销售额除以宝贝数量 衡量 竞争程度。

byprice1 = byfun(df24,'价格区间')
def mcplot(bydf,figsize=(10,4)):
    ax = bydf.plot(y='相对竞争度',linestyle='-',marker='o',figsize=figsize)
    bydf.plot(y='销售额占比',kind='bar',alpha=0.8,color='wheat',ax=ax)
    plt.show()
 mcplot(byprice1)
           
怎么用python电商文本挖掘?(3)

结果依单宝贝销售额降序,即依竞争度升序可见0-50容量大,竞争大,大容量市场(对比的是50-100,容量小,竞争稍小)200-250,竞争小,做高价市场的优先选择,属于机会点。

8.找到细分市场价格区间后 进一步价格细分分析

df25 = df24[df24['价格区间']=='0-50']
df25['售价'].plot.hist()
           
怎么用python电商文本挖掘?(3)
bins1 = [0,10,20,30,40,50]
labels1 = ['0_10','10_20','20_30','30_40','40_50']
df25['价格子区间'] = pd.cut(df25['售价'],bins1,labels=labels1,include_lowest=True)
byprice2 = byfun(df25,'价格子区间')
byprice2
mcplot(byprice2)
           
怎么用python电商文本挖掘?(3)

可见10-20竞争度低,容量大,优选,20-30也不错200-250细分市场也是同样的分析思路.

9.细分市场 商品属性分析

店铺类型:

怎么用python电商文本挖掘?(3)

可见天猫产品销售额和相对竞争度都优于淘宝

型号:

怎么用python电商文本挖掘?(3)

可见虽然粘鼠板市场份额普遍较高,但是0005在竞争度上有明显的优势

物理形态:

怎么用python电商文本挖掘?(3)

可见市场份额最高的是固体,竞争度也偏高,而胶水虽然竞争度低,但是市场份额较低基本可以认为常见的物理形态就是固体。

净含量:

怎么用python电商文本挖掘?(3)

可见当物理形态为固体,净含量为1时,潜力较大.