天天看點

關于MATLAB處理大資料坐标檔案2017527

第一次送出資料:

今天用了8個特征,加上的這一個特征是 從3000條測試資料中測試失敗的資料總結出來的

樹的數目為50

再次使用3000條測試資料測試結果—— 結果不錯: 99%

但是運作官網資料結果分數——降低0.5      為58.55分

總結:總特征數目為8,樹的數目遠遠超過特征數,以後樹的數目不能多于特征的1.5倍,否則結果很難得出結論,無說服力

第二次送出資料:

本次使用9個特征,加上的特征是 從3000條測試資料中測試失敗的資料總結出來的

樹的數目為12

使用3000條測試資料測試結果—— 結果不錯: 99%

運作官網資料結果分數有所提升

總結:總特征數目為9,樹的數目12,正确率上升,事實說明 :一個沒有特征的決策樹會也會抽取資料訓練 , 最終也會對随機森林最終結果産生影響

        那麼繼續觀察以前的失敗資料,提取新的特征