读《scikiit-learn机器学习》第七章

    xiaoxiao2022-07-03  119

    什么是信息熵,其计算公式是什么

    一条信息的信息量和它的不确定性有直接关系,一个问题不确定性越大,要搞清这个问题,需要了解的信息量就越多,其信息熵就越大

    什么是信息增益?

    信息熵变换幅度

    在决策树创建过程中,用什么方法来选择特征,从而经行数据划分

    选择信息增益最大得特征,并用这个特征作为数据集划分节点来划分数据

    决策树如何处理连续值得特征

    需要经行离散化处理,要离散化成几个类

    除了信息增益外,还有什么标准可以用来选择决策树得特征

    基尼不纯度

    解决决策树过拟合有那些方法

    剪纸算法

    decisionTreeClassifier提供那些参数来解决决策树过拟合问题

    splitter:创建决策树分支选项 max_deth:决定决策树得最大深度

    最新回复(0)