什么是信息熵,其计算公式是什么
一条信息的信息量和它的不确定性有直接关系,一个问题不确定性越大,要搞清这个问题,需要了解的信息量就越多,其信息熵就越大
什么是信息增益?
信息熵变换幅度
在决策树创建过程中,用什么方法来选择特征,从而经行数据划分
选择信息增益最大得特征,并用这个特征作为数据集划分节点来划分数据
决策树如何处理连续值得特征
需要经行离散化处理,要离散化成几个类
除了信息增益外,还有什么标准可以用来选择决策树得特征
基尼不纯度
解决决策树过拟合有那些方法
剪纸算法
decisionTreeClassifier提供那些参数来解决决策树过拟合问题
splitter:创建决策树分支选项 max_deth:决定决策树得最大深度