天天看點

機器學習中的 上采樣 下采樣 過采樣 欠采樣

1. 過采樣和欠采樣

這是兩種解決分類訓練過程中資料量不平衡的采樣方法

拿二分類舉例,期望陽性樣本數量:陰性樣本數量 = 1:1,但實際上陽性樣本數量:陰性樣本數量 = 1000:100

過采樣

将100資料複制10份,達到兩個樣本數量之比為1000:1000

欠采樣

将1000資料随機抽取100份,達到兩個樣本數量之比為100:100

2. 上采樣和下采樣

卷積神經網絡(CNN)是由卷積層/池化層/激活層……組成的“自上而下”的多層網絡,原始圖像從CNN頂層輸入,到底層生成特征圖,這個過程稱為下采樣

相反的,由一個特征圖反推出原圖的過程稱為上采樣