機器學習之決策樹算法（二）

2023-04-28 11:06:18

前言

一、機器學習中分類和預測算法的評估，那麼是根據哪些因素來評估一個算法的好壞和優越：

準确性
速度
強壯行
可規模性
可解釋性

決策樹-監督學習

決策樹是一個類似于流程圖的樹結構：每個内部結點表示在一個屬性上的測試，每個分支代表一個屬性輸出，而每個樹葉結點代表類或類分布，樹的最頂層是根結點。

機器學習之決策樹算法（二）

決策樹的優缺點

優點：直覺，便于了解，小規模資料集有效

缺點：處理連續變量不好，類别較多時，錯誤增加的比較快，可規模性一般

案例：

import pandas as pd
# 資料讀取
iris_data = pd.read_csv('iris.data')
iris_data.columns = ['sepal_length_cm', 'sepal_width_cm', 'petal_length_cm', 'petal_width_cm', 'class']
# 
a = iris_data.head()
print(a)

from sklearn.cross_validation import train_test_split
from sklearn.tree import DecisionTreeClassifier

all_inputs = iris_data[['sepal_length_cm', 'sepal_width_cm',
                         'petal_length_cm', 'petal_width_cm']].values

all_classes = iris_data['class'].values
(training_inputs, testing_inputs, training_classes, testing_classes) = train_test_split(all_inputs, all_classes, train_size=0.75, random_state=1)

#建立模型
decision_tree_classifier = DecisionTreeClassifier()

# 在訓練集上訓練分類器
decision_tree_classifier.fit(training_inputs, training_classes)

# 使用分類準确性驗證測試集上的分類器
decision_tree_classifier.score(testing_inputs, testing_classes)

輸出結果:0.97368421052631582

完整代碼我這裡就不貼了。。。到時我會上傳到github！ (__) 嘻嘻……

機器學習之決策樹算法（二）

前言

繼續閱讀

來自python的【條件控制/語句循環/break/continue/else/pass】一、條件控制二、語句循環

無法解析的外部符号 wmain，該符号在函數 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink導出用例轉換工具(XML2Excel)

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入