天天看點

驗證利用numpy和sklearn方法進行标準化的結果是否一緻1 标準化公式2 利用np.mean,np.std進行計算3 利用preprocessing.StandardScaler()進行計算

目錄

  • 1 标準化公式
  • 2 利用`np.mean`,`np.std`進行計算
  • 3 利用`preprocessing.StandardScaler()`進行計算

1 标準化公式

( S a m p l e − m e a n ) s t d \frac{(Sample - mean)}{std} std(Sample−mean)​

計算時對每個屬性/每列分别進行

Sample

是一個

(n_samples, n_features)

的數組,行代表有幾組樣本,清單示屬性特征

2 利用

np.mean

,

np.std

進行計算

對其中一列屬性進行計算并對比:

驗證利用numpy和sklearn方法進行标準化的結果是否一緻1 标準化公式2 利用np.mean,np.std進行計算3 利用preprocessing.StandardScaler()進行計算

3 利用

preprocessing.StandardScaler()

進行計算

scaler =  preprocessing.StandardScaler().fit(Sample)
Sample_scaled = scaler.transform(Sample)  #标準化後的資料
print(Sample_scaled[:,0])
           
驗證利用numpy和sklearn方法進行标準化的結果是否一緻1 标準化公式2 利用np.mean,np.std進行計算3 利用preprocessing.StandardScaler()進行計算

結果是一緻的!