天天看點

資料預處理與資料增強

資料預處理與資料增強

資料增強技術被證明了有利于通用的尤其是深度的機器學習架構的訓練,無論是加速收斂過程還是作為一個正則項,這也避免了過拟合并增強了模型泛化能力[15]。

資料增強一般包括在資料空間或特征空間(或二者均有)上應用一系列的遷移技術。在資料空間上應用增強技術最常見,這種增強技術應用遷移方法從已有資料中得到新的樣本。有很多的可用的遷移方法:平移、旋轉、扭曲、縮放、顔色空間轉換、裁剪等。這些方法的目标均是通過生成更多的樣本來建構更大的資料集,防止過拟合以及對模型進行正則化,還可以對該資料集的各個類的大小進行平衡,甚至手工地産生對目前任務或應用場景更加具有代表性的新樣本。

資料增強對小資料集尤其有用,而且其效用已經在長期使用過程中被證明。例如,在[26]中,有1500張肖像圖檔的資料集通過設計4個新的尺寸(0.6,0.8,1.2,1.5),4個新的旋角(-45,-22,22,45),以及4個新的gamma變化(0.5,0.8,1.2,1.5)被增強為有着19000張訓練圖像的資料集。通過這一處理,當使用增強資料集進行微調時,其肖像畫分割系統的交疊準确率(IoU)從73.09%提升到了94.20%。

繼續閱讀