驗證利用numpy和sklearn方法進行标準化的結果是否一緻1 标準化公式2 利用np.mean,np.std進行計算3 利用preprocessing.StandardScaler()進行計算

2023-08-02 23:26:49

1 标準化公式

( S a m p l e − m e a n ) s t d \frac{(Sample - mean)}{std} std(Sample−mean)

計算時對每個屬性/每列分别進行

Sample

是一個

(n_samples, n_features)

的數組，行代表有幾組樣本，清單示屬性特征

2 利用 `np.mean` , `np.std` 進行計算

對其中一列屬性進行計算并對比：

驗證利用numpy和sklearn方法進行标準化的結果是否一緻1 标準化公式2 利用np.mean,np.std進行計算3 利用preprocessing.StandardScaler()進行計算

scaler =  preprocessing.StandardScaler().fit(Sample)
Sample_scaled = scaler.transform(Sample)  #标準化後的資料
print(Sample_scaled[:,0])

驗證利用numpy和sklearn方法進行标準化的結果是否一緻1 标準化公式2 利用np.mean,np.std進行計算3 利用preprocessing.StandardScaler()進行計算

結果是一緻的！