使用python对信息熵进行计算

2023-08-02 19:15:06

在机器学习中的决策树类算法中主要依靠信息熵的大小来选择重要的特征属性作为节点换分数据集从而获得训练结果

#-*-coding:utf-8-*-
from math import log
import operator

def calcShanonEnt(dataSet):
    '''
    计算给定数据集的香农熵
    :param dataSet:
    :return:shanonEnt
    '''
    numEntries = len(dataSet)
    labelCounts={}
    for featVec in dataSet:
        currentLabel = featVec[-1]
        if currentLabel not in labelCounts.keys():
            labelCounts[currentLabel]=0
        labelCounts[currentLabel] +=1
    shanonEnt = 0.0
    for key in labelCounts:
        prob= float(labelCounts[key])/numEntries
        shanonEnt -= prob*log(prob,2)
    return shanonEnt

作者：WangB

使用python对信息熵进行计算

继续阅读

Python_支持向量机分类器

将matlab程序生成的曲线导入solidworks中并生成实体

关于sw导入曲线的具体说明

MATLAB三维绘图函数汇总

模态分析实例—斜齿圆柱齿轮的固有频率分析

文本字符串的分词化处理

三维散点绘制三维曲面图

非参数统计单样本非参数检验之Kolmogorov-Smirnov检验

pyhton_基尼指数计算

使用python对决策树算法进行学习

PyQt5之菜单编程

机器学习笔记对sklearn的线性回归器进行学习

Python for循环语句

图像卷积及其Python实现

python常用概率分布直方图绘制

Python函数定义和调用