目錄
- 1 标準化公式
- 2 利用`np.mean`,`np.std`進行計算
- 3 利用`preprocessing.StandardScaler()`進行計算
1 标準化公式
( S a m p l e − m e a n ) s t d \frac{(Sample - mean)}{std} std(Sample−mean)
計算時對每個屬性/每列分别進行
Sample
是一個
(n_samples, n_features)
的數組,行代表有幾組樣本,清單示屬性特征
2 利用 np.mean
, np.std
進行計算
np.mean
np.std
對其中一列屬性進行計算并對比:

3 利用 preprocessing.StandardScaler()
進行計算
preprocessing.StandardScaler()
scaler = preprocessing.StandardScaler().fit(Sample)
Sample_scaled = scaler.transform(Sample) #标準化後的資料
print(Sample_scaled[:,0])
結果是一緻的!