天天看點

pandas之values和value_count()用法:結合JData ”使用者購買時間預測“資料分析執行個體(一)

表1:SKU基本資訊表(jdata_sku_basic_info)

pandas之values和value_count()用法:結合JData ”使用者購買時間預測“資料分析執行個體(一)
pandas之values和value_count()用法:結合JData ”使用者購買時間預測“資料分析執行個體(一)

1. 讀取資料,并擷取部分特征的最大值,最小值,均值和中位數

pandas之values和value_count()用法:結合JData ”使用者購買時間預測“資料分析執行個體(一)

2. df.info()給出DataFrame資料的基本資訊

pandas之values和value_count()用法:結合JData ”使用者購買時間預測“資料分析執行個體(一)

3. df.column.values   以array形式傳回指定column的所有取值

pandas之values和value_count()用法:結合JData ”使用者購買時間預測“資料分析執行個體(一)

4. df.column.value_counts()  以Series形式傳回指定列的不同取值的頻率

pandas之values和value_count()用法:結合JData ”使用者購買時間預測“資料分析執行個體(一)
pandas之values和value_count()用法:結合JData ”使用者購買時間預測“資料分析執行個體(一)
pandas之values和value_count()用法:結合JData ”使用者購買時間預測“資料分析執行個體(一)

value_count() 的參數:

(1) normalize : boolean, default False             如果為True,則傳回的對象将包含唯一值的相對頻率。

sort : boolean, default True             按值排序

ascending : boolean, default False        按頻率計數升序排序

bins : integer, optional    而不是數值計算,把它們分成半開放的箱子,一個友善的pd.cut,隻适用于數字資料

dropna : boolean, default True          不包括NaN的數量。

pandas之values和value_count()用法:結合JData ”使用者購買時間預測“資料分析執行個體(一)