大数据算法(哈尔滨工业大学)2023章节测试答案超星尔雅
D、差得很远
我的答案:AD
2、【判断题】全0数组判定的近似算法的证据引理是:如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于1/2。
我的答案:X
3、【判断题】判定问题的近似解是指:输入满足某种性质或近似满足某种性质。
我的答案:X
3.1数据流中频繁元素
1、【判断题】Zipf原则是指典型的频率分布是高度偏斜的,存在很多频繁元素。()
我的答案:X
2、【判断题】在数据流模型中,从数据流中可以计算简单的函数,如最大值、最小值、求和等,且处理这些函数时通常使用单个寄存器s。()
我的答案:√
3、【判断题】数据流模型中,数据流是指来自某个域中的元素序列。()
我的答案:√
4、【判断题】在数据流模型中,内存远远大于数据的规模。()
我的答案:X
3.2频繁元素计算算法
1、【单选题】频繁元素计算算法又称为()算法。
A、MM
B、MG
C、GM
D、MP
我的答案:B
2、【单选题】频繁元素计算算法有效的原因是源于()。
A、取近似解
B、证据引理
C、错误界限和k成反比
D、Zipf原则
我的答案:D
3、【判断题】在频繁元素计算算法中,计数器x减少的次数依赖于有几个减少计数器的步骤。()
我的答案:√
4、【判断题】在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差的最多值时,可以得到频繁项一个好的估计。
我的答案:√
3.3最小生成树
1、【单选题】时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。
A、近似值
B、精确值
C、权重
D、界限
我的答案:C
2、【单选题】求最小生成树是一个贪心法,可以用()算法来解决。
A、Prime
B、并行
C、MG
D、内存
我的答案:A
3、【判断题】对联通分量个数的估计可以利用随机化方法。
我的答案:√
3.4序列有序的判定
1、【单选题】对于输入n个数的数组(x1,x2,x3,……,xn),输出:这个数组是否有序。ℇ远离意味着必须删除大于()个元素才能保证剩下的元素有序。
A、ℇ-n
B、ℇn
C、ℇ/n
D、n/ℇ
我的答案:B
2、【判断题】如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于3/4。
我的答案:X
3、【判断题】关于证明如果输入ℇ远离有序,则存在大于ℇn个“坏索引”的问题,可以采用证明其逆否命题的方法。
我的答案:√
4.1外存存储结构与外存算法
1、【单选题】下列选项中叙述正确的是()。
A、磁盘的访问可以随机读、随机取
B、磁盘系统传输大规模连续的数据块的范围是18-32k
C、磁盘访问比主存访问的速度快
D、大多数程序在RAM模型上运行
我的答案:D
2、【判断题】对于大数据而言,标准计算理论模型失效的原因之一是内存是有限的,无法存储所有的内存。()