首页
()的搜索策略是指按照深度由低到高的顺序,依次访问下一级网页链接,直到不能再深入为止,比较适合垂直搜索或站内搜索。
精华吧
→
答案
→
远程教育
→
国家开放大学
()的搜索策略是指按照深度由低到高的顺序,依次访问下一级网页链接,直到不能再深入为止,比较适合垂直搜索或站内搜索。
正确答案:深度优先
Tag:
深度
顺序
策略
时间:2023-11-20 10:18:20
上一篇:
以下哪个HTTP响应状态表示客户端错误()。
下一篇:
关于各种网络爬虫,以下说法不正确的是()。
相关答案
1.
通过使用Web浏览器、网络爬虫或者其它的工具,客户端发起一个到服务器上指定端口的HTTP请求。我们称这个客户端叫()。
2.
增量式爬虫中的()指的是:爬虫根据网页改变频率将其分为更新较快网页子集和更新较慢网页子集两类,然后以不同的频率访问这两类网页。
3.
在HTTP请求中,通过()方法发送的数据,会放在URL之后,以?分割URL和传输数据,参数之间以&相连。
4.
()只会在需要的时候爬行新产生或发生更新的页面,并不重新下载没有发生变化的页面,可有效减少数据下载量,及时更新已爬行的网页,减小时间和空间上的耗费,但是增加了爬行算法的复杂度和实现难度。
5.
HTTP请求中()头域的内容包含发出请求的用户信息。
6.
关于HTTP请求方法中GET和POST的区别,以下说法不正确的是()。
7.
Keep-Alive功能虽然为客户保留打开的连接有一定的好处,但它同样影响了性能。
8.
增量式网络爬虫能够在一定程度上保证所爬行的页面是尽可能新的页面。
9.
网络爬虫可能造成个人隐私泄露。
10.
聚焦网络爬虫能够在一定程度上保证所爬行的页面是尽可能新的页面。
热门答案
1.
实际的网络爬虫系统通常是单一类型的爬虫。
2.
HTTP请求中的“Connection:keep-alive”表示当前连接持续保持。
3.
HTTP响应中的Expires用于指示资源的最后修改日期和时间。
4.
只能通过使用浏览器发起一个到服务器上指定端口的HTTP请求。
5.
HTTP协议是有状态协议。
6.
通用网络爬虫通常采用串行工作方式。
7.
HTTP响应中的Content-Length用于指定整个实体中的一部分的插入位置,也指示了整个实体的长度。
8.
增量式爬虫的目标只有保持本地页面集中存储的页面为最新页面。
9.
计算机往往既要处理结构化数据,同时还要处理视频、语音等非结构化数据。
10.
现有聚焦爬虫对抓取目标的描述只包括基于目标数据模式这种方式。