首页
数据预处理涉及数据整理和整合的各个方面,包括数据清洗、筛选和数据变换,用于数据挖掘前的模型选择等,有助于提高数据挖掘的效率。
精华吧
→
答案
→
远程教育
→
国家开放大学
数据预处理涉及数据整理和整合的各个方面,包括数据清洗、筛选和数据变换,用于数据挖掘前的模型选择等,有助于提高数据挖掘的效率。
A、正确
B、错误
正确答案:A
Tag:
数据
模型
效率
时间:2024-03-21 12:22:05
上一篇:
缺失值是不受标准化过程影响的。
下一篇:
下列代码可以将数据集data中的重复个体检测出的是()。
相关答案
1.
下列关于抽样的说法错误的是()。
2.
一些数据集是由合并数据源形成的,这就使其有可能含有重复数据或者近似重复的个体。
3.
duplicated()函数可以将数据中的重复值直接筛选出来。
4.
缺失值会受到标准化过程影响。
5.
下列关于函数duplicated()的说法正确的是()。
6.
下列关于函数duplicated()的说法不正确的是()。
7.
数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作。
8.
数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作,数据整合不包括()。
9.
离散化是一种将连续取值的变量转换成一个分类变量的数据预处理步骤。
10.
下列不属于期望预测误差的是()。
热门答案
1.
下列关于主成分的属性说法错误的是()。
2.
离散化是一种将分类取值的变量转换成一个连续变量的数据预处理步骤。
3.
下列关于抽样的说法正确的是()。
4.
设定虚拟变量时,对于每个样本而言,同一个定性变量对应虚拟变量的值之和不超过1。
5.
数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作,数据整合包括()。
6.
无放回抽样有可能对同一个个体抽中了多次,有放回抽样则将抽出来的个体从抽样对象中去除,因此不会有重复的个体。
7.
有放回抽样有可能对同一个个体抽中了多次,无放回抽样则将抽出来的个体从抽样对象中去除,因此不会有重复的个体。
8.
设定虚拟变量时,对于有k个表现值的定性变量,只设定(k()1)个虚拟变量。
9.
设定虚拟变量时,虚拟变量的值通常用“0”或“1”来表示。
10.
主成分是原始变量的线性组合,它们相互正交(垂直),捕获了数据差异最大的方向。