大数据算法(哈尔滨工业大学)2023章节测试答案超星尔雅


D、差得很远

我的答案:AD

2、【判断题】全0数组判定的近似算法的证据引理是:如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于1/2。

我的答案:X

3、【判断题】判定问题的近似解是指:输入满足某种性质或近似满足某种性质。

我的答案:X

3.1数据流中频繁元素

1、【判断题】Zipf原则是指典型的频率分布是高度偏斜的,存在很多频繁元素。()

我的答案:X

2、【判断题】在数据流模型中,从数据流中可以计算简单的函数,如最大值、最小值、求和等,且处理这些函数时通常使用单个寄存器s。()

我的答案:√

3、【判断题】数据流模型中,数据流是指来自某个域中的元素序列。()

我的答案:√

4、【判断题】在数据流模型中,内存远远大于数据的规模。()

我的答案:X

3.2频繁元素计算算法

1、【单选题】频繁元素计算算法又称为()算法。

A、MM

B、MG

C、GM

D、MP

我的答案:B

2、【单选题】频繁元素计算算法有效的原因是源于()。

A、取近似解

B、证据引理

C、错误界限和k成反比

D、Zipf原则

我的答案:D

3、【判断题】在频繁元素计算算法中,计数器x减少的次数依赖于有几个减少计数器的步骤。()

我的答案:√

4、【判断题】在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差的最多值时,可以得到频繁项一个好的估计。

我的答案:√

3.3最小生成树

1、【单选题】时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。

A、近似值

B、精确值

C、权重

D、界限

我的答案:C

2、【单选题】求最小生成树是一个贪心法,可以用()算法来解决。

A、Prime

B、并行

C、MG

D、内存

我的答案:A

3、【判断题】对联通分量个数的估计可以利用随机化方法。

我的答案:√

3.4序列有序的判定

1、【单选题】对于输入n个数的数组(x1,x2,x3,……,xn),输出:这个数组是否有序。ℇ远离意味着必须删除大于()个元素才能保证剩下的元素有序。

A、ℇ-n

B、ℇn

C、ℇ/n

D、n/ℇ

我的答案:B

2、【判断题】如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于3/4。

我的答案:X

3、【判断题】关于证明如果输入ℇ远离有序,则存在大于ℇn个“坏索引”的问题,可以采用证明其逆否命题的方法。

我的答案:√

4.1外存存储结构与外存算法

1、【单选题】下列选项中叙述正确的是()。

A、磁盘的访问可以随机读、随机取

B、磁盘系统传输大规模连续的数据块的范围是18-32k

C、磁盘访问比主存访问的速度快

D、大多数程序在RAM模型上运行

我的答案:D

2、【判断题】对于大数据而言,标准计算理论模型失效的原因之一是内存是有限的,无法存储所有的内存。()


Tag:大数据算法 时间:2023-04-15 14:35:05