使用python對資訊熵進行計算

2023-08-02 19:15:06

在機器學習中的決策樹類算法中主要依靠資訊熵的大小來選擇重要的特征屬性作為節點換分資料集進而獲得訓練結果

#-*-coding:utf-8-*-
from math import log
import operator

def calcShanonEnt(dataSet):
    '''
    計算給定資料集的香農熵
    :param dataSet:
    :return:shanonEnt
    '''
    numEntries = len(dataSet)
    labelCounts={}
    for featVec in dataSet:
        currentLabel = featVec[-1]
        if currentLabel not in labelCounts.keys():
            labelCounts[currentLabel]=0
        labelCounts[currentLabel] +=1
    shanonEnt = 0.0
    for key in labelCounts:
        prob= float(labelCounts[key])/numEntries
        shanonEnt -= prob*log(prob,2)
    return shanonEnt

作者：WangB

使用python對資訊熵進行計算

繼續閱讀

Python_支援向量機分類器

将matlab程式生成的曲線導入solidworks中并生成實體

關于sw導入曲線的具體說明

MATLAB三維繪圖函數彙總

模态分析執行個體—斜齒圓柱齒輪的固有頻率分析

文本字元串的分詞化處理

三維散點繪制三維曲面圖

非參數統計單樣本非參數檢驗之Kolmogorov-Smirnov檢驗

pyhton_基尼指數計算

使用python對決策樹算法進行學習

PyQt5之菜單程式設計

機器學習筆記對sklearn的線性回歸器進行學習

Python for循環語句

圖像卷積及其Python實作

python常用機率分布直方圖繪制

Python函數定義和調用