第一次送出資料:
今天用了8個特征,加上的這一個特征是 從3000條測試資料中測試失敗的資料總結出來的
樹的數目為50
再次使用3000條測試資料測試結果—— 結果不錯: 99%
但是運作官網資料結果分數——降低0.5 為58.55分
總結:總特征數目為8,樹的數目遠遠超過特征數,以後樹的數目不能多于特征的1.5倍,否則結果很難得出結論,無說服力
第二次送出資料:
本次使用9個特征,加上的特征是 從3000條測試資料中測試失敗的資料總結出來的
樹的數目為12
使用3000條測試資料測試結果—— 結果不錯: 99%
運作官網資料結果分數有所提升
總結:總特征數目為9,樹的數目12,正确率上升,事實說明 :一個沒有特征的決策樹會也會抽取資料訓練 , 最終也會對随機森林最終結果産生影響
那麼繼續觀察以前的失敗資料,提取新的特征