首页

异常数据都是需要删除处理的。


精华吧→答案→知识竞赛→职工技术创新运动会技能大赛

异常数据都是需要删除处理的。

A、正确

B、错误

正确答案:B


Tag:人工智能训练师职业技能竞赛 数据 时间:2024-03-31 22:20:23

  • 上一篇:Hadoop分布式并行计算框架的执行是以任务展开,Storm分布式并行计算框架任务则是以提交拓扑的方式开始。
  • 下一篇:HDFS是Hadoop架构中提供的数据存储组件。

相关答案

  • 1.HBase数据库中,用户读写操作通过HMaster实现。
  • 2.传统数据采集的数据都是非结构化的数据。
  • 3.商业领域产生的数据量非常庞大,消费者的行为都会成为对企业非常有价值的数据来源。
  • 4.Flink的流水线运行时系统可以执行批处理和流处理程序,但是不支持迭代算法。
  • 5.分布式文件系统的设计目标是高性能、可伸缩性、可靠性及高安全性。
  • 6.DataWorks是阿里云提供的一站式大数据开发处理平台。
  • 7.Hadoop主要用于存储结构化数据。
  • 8.关系数据库可以存储结构化、非结构化数据。
  • 9.Nutch项目开发了自己的分布式文件系统NDFS。
  • 10.Hadoop的可扩展性错,不能随意增加节点。

热门答案

  • 1.Spark基于硬盘计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序。
  • 2.Hive用于对数据进行分析,本身不存储数据,数据存储在HDFS系统中。
  • 3.数据库是可共享、具有独立性的数据集合。
  • 4.在MapReduce计算模型中,数据经过Reduce阶段处理后传送给Map阶段继续处理。
  • 5.均方根误差与均方误差二者没有关系。
  • 6.回归中利用最小二乘法主要通过最小化误差的平方来寻找一个数据匹配的最佳函数。
  • 7.同一个列表中的元素的数据类型可以各不相同。
  • 8.Pandas中利用merge函数合并数据表时默认的是内连接方式。
  • 9.准确率是所有正确识别的样本占样本总量的比例。当所有类别都同等重要时,采用准确率最为简单直观。
  • 10.寻找最优超参数费时费力,应该在模型训练之前就指定最优参数。

精华吧