機器學習課堂筆記(十四)

使用低維資料來近似表示高維資料
通過資料可視化來獲得降維資料的實體意義
Σ 和 ∑ni=1 不同
Σ 的計算對于所有的樣本值
此時計算的是一個樣本值 x(i) 的降維 z(i)
保留99%的差異性
[U,S,V] = svd(Sigma)調用一次
使用訓練集運作PCA,這樣定義了x-z的映射,可将其應用于測試集合交叉驗證集
PCA應用于可視化時,k=2或k=3
使用PCA避免過拟合将會丢失資訊
首先使用原始資料,當算法表現不好時再考慮PCA
使用低維資料來近似表示高維資料
通過資料可視化來獲得降維資料的實體意義
Σ 和 ∑ni=1 不同
Σ 的計算對于所有的樣本值
此時計算的是一個樣本值 x(i) 的降維 z(i)
保留99%的差異性
[U,S,V] = svd(Sigma)調用一次
使用訓練集運作PCA,這樣定義了x-z的映射,可将其應用于測試集合交叉驗證集
PCA應用于可視化時,k=2或k=3
使用PCA避免過拟合将會丢失資訊
首先使用原始資料,當算法表現不好時再考慮PCA