天天看點

數學模組化2 資料預處理

注意

題目給出的資料不能直接使用,要對資料進行異常處理

缺失值

1.缺失值太多就要把該項名額删除(40%相當大)

2.處理:對精度不高

定量資料,使用均值

定性資料,使用衆數

3.對資料精度有要求

但對導數沒有要求,使用牛頓插值法

對導數有要求,使用樣條插值法(飛機機翼,醫學圖像)

數學模組化2 資料預處理

異常值

1.先找到異常值,再将其删去,用上面缺失值的方式補上

2.找異常值:正态分布(不适合排隊論)

在正态分布中σ代表标準差,μ代表均值,x=μ即為圖像的對稱軸。

标準差

數學模組化2 資料預處理
數學模組化2 資料預處理

3.畫箱型圖(普遍适用)

1)從上到下,即資料從大到小

2)IQR越大,箱子越大,資料分散

3)在區間範圍之外為異常值

數學模組化2 資料預處理

繼續閱讀