缺失值处理方法中错误的是()。
缺失值处理方法中错误的是()。
A.对于分类属性,使用同类对象属性值的均值
B.对于离散属性或定性属性,使用众数
C.对于所有属性都可以使用均值
D.转换为分类问题或数值预测问题
正确答案:对于所有属性都可以使用均值
- 1.下列不属于数据预处理原因的是()。
- 2.()是指对描述对象的属性进行重新组合,获得一组反映事物本质的少量的新的属性的过程。()是指从属性集合中选择那些重要的、与分析任务相关的子集的过程。
- 3.关联规则的挖掘算法只能处理()类型的取值,为此()是继续其知识发现过程的必要步骤。
- 4.在使用主成分分析法进行数据属性特征提取中,在对数据集进行中心化处理后,为了去除冗余和降低噪音,应将协方差矩阵非对角线上的元素化为()。
- 5.特征选择方法中,一般的启发式方法有()。
- 6.使用等距离分箱法进行数据离散化,数据范围为20, 40, 50, 58, 65, 80, 80, 82, 86, 90, 96, 105, 120, 200,区间个数为4。下列属于4个箱的区间是()。
- 7.使用零均值规范化方法,年收入属性的均值为65,标准差为12,则年收入59万元规范化后为()。
- 8.使用最小-最大法进行数据规范化,需要映射的目标区间为[0,100],原来的取值范围是[-10,10]。根据等比映射的原理,一个值8映射到新区间后的值是()。
- 9.运行以下代码” import matplotlib.pyplot as plt”引入plt后,要绘制散点图,需要利用的函数为()。
- 10.运行以下代码” import matplotlib.pyplot as plt”引入plt后,要绘制直方图,需要利用的函数为()。
- 1.运行以下代码” import matplotlib.pyplot as plt”引入plt后,要绘制折线图,需要利用的函数为()。
- 2.运行以下代码” import matplotlib.pyplot as plt”引入plt后,要绘制饼状图,需要利用的函数为()。
- 3.给定df是一个DataFrame对象,对df所有字段进行描述性统计,可以利用的方法为()。
- 4.在Numpy包中,计算标准差的函数为()。
- 5.在Numpy包中,计算中位数的函数为()。
- 6.运行以下代码from sklearn.datasets import load()irisiris()data = load()iris()iris()data.data.shape输出结果为(150, 4)。则表示iris数据集包括样本特征数为()。
- 7.运行以下代码from sklearn.datasets import load()irisiris()data = load()iris()iris()data.data.shape输出结果为(150, 4)。则表示iris数据集包括样本个数为()。
- 8.x=(5,0,3,0,2,0,0,2,0,0)和y=(3,0,2,0,1,1,0,1,0,1),使用余弦相似度公式计算这两个向量之间的相似性等于()。【如果计算结果是小数,则保留一位;如果是整数,则直接填写整数】
- 9.给定两个数据对象(19,4,5)和(22,6,3),则两个对象之间的上确界距离()。【如果计算结果是小数,则保留一位;如果是整数,则直接填写整数】
- 10.给定两个数据对象(19,4,5)和(22,6,3),则两个对象之间的曼哈顿距离()。【如果计算结果是小数,则保留一位;如果是整数,则直接填写整数】