注意
題目給出的資料不能直接使用,要對資料進行異常處理
缺失值
1.缺失值太多就要把該項名額删除(40%相當大)
2.處理:對精度不高
定量資料,使用均值
定性資料,使用衆數
3.對資料精度有要求
但對導數沒有要求,使用牛頓插值法
對導數有要求,使用樣條插值法(飛機機翼,醫學圖像)
異常值
1.先找到異常值,再将其删去,用上面缺失值的方式補上
2.找異常值:正态分布(不适合排隊論)
在正态分布中σ代表标準差,μ代表均值,x=μ即為圖像的對稱軸。
标準差
3.畫箱型圖(普遍适用)
1)從上到下,即資料從大到小
2)IQR越大,箱子越大,資料分散
3)在區間範圍之外為異常值