首页
CART决策树使用Gini值作为评判标准.类别分布越均匀,则Gini值越大;类分布越不均匀,则Gini值越小.
精华吧
→
答案
→
网课
CART决策树使用Gini值作为评判标准.类别分布越均匀,则Gini值越大;类分布越不均匀,则Gini值越小.
正确答案:正确
Tag:
类别
标准
决策树
时间:2024-04-20 10:57:03
上一篇:
如果一个项集是非频繁的,那么其所有的超集(supersets)也一定是非频繁的。
下一篇:
一般来说,如果数据集是稠密的,并且数据集不是凸的,那么用DBSCAN会比K()Means聚类效果好.
相关答案
1.
一般来讲,模型误差=方差+偏差+不可避免的随机误差。
2.
AdaBoost算法将各个训练得到的弱分类器组合成强分类器.其中误差率高的弱分类器在最终分类器中占的权重较大,否则较小.
3.
聚类的过程可以看作是一种非监督的分类过程。
4.
数据分类方法通常有:决策树法、朴素贝叶斯法、人工神经网络法等。
5.
对于机器学习中学习(构建)的模型,模型误差=方差+偏差+不可避免的随机误差。
6.
Apriori算法中的一个先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。
7.
一般模型越简单,学习能力越强,bias越小但variance越大。
8.
K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定
9.
啤酒与尿布的经典案例,充分体现了历果关系在大数据分析理念中的重要性。
10.
在SVM训练好后,我们可以抛弃非支持向量的样本点,仍然可以对新样本进行分类。
热门答案
1.
可信度是对关联规则的准确度的衡量
2.
感知器作为人工神经网络中最基本的单元,有多个输入和一个输出组成。
3.
在Sklearn里面有六大任务模块:分别是分类、回归、聚类、降维、模型选择和预处理
4.
感知器sign(wx+b)的学习算法是误分类驱动的,因此可采用梯度类下降算法进行更新参数w和b.
5.
谱聚类是基于样本间的相似矩阵,通过代数方法将数据降维,然后在低维空间中使用其它聚类方法(如KMeans)进行聚类。
6.
随机森林中的每一棵分类树为二叉树,其生成遵循自顶向下的递归分裂原则,即从根节点开始依次对训练集进行划分
7.
对于具有线性输出层和至少一个使用“挤压”性质的激活函数的隐藏层组成的前馈神经网络,只要其隐藏层神经元的数量足够,它可以以任意的精度来近似任何从一个定义在实数空间中的有界闭集函数。
8.
在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是泛化误差开始增大,这是出现了模型拟合不足的问题
9.
Apriori算法中,具有较高的支持度的项集具有较高的置信度。
10.
随机森林算法中不再使用剪枝技术,这是因为算法中的两个随机采样过程保证了随机性,所以即使不剪枝,也不会出现过拟合.