首页
广度优先爬行策略的不足之处在于需较长时间才能爬行到目录层次较深的页面。
精华吧
→
答案
→
远程教育
→
国家开放大学
广度优先爬行策略的不足之处在于需较长时间才能爬行到目录层次较深的页面。
A.正确
B.错误
正确答案:A
Tag:
广度
层次
策略
时间:2023-11-20 10:22:02
上一篇:
关于表层网页及深层网页,以下说法不正确的是()。
下一篇:
HTTP响应中的Expires表示浏览器应该在多少时间之后刷新文档。
相关答案
1.
()又称全网爬虫,爬行对象从一些种子URL扩充到整个Web,主要为门户站点搜索引擎和大型Web服务提供商采集数据。
2.
()爬行过程中最重要部分就是表单填写及处理。
3.
HTTP请求中的()头域的内容包含发出请求的用户信息。
4.
HTTP响应中的()等分别用于指定消息发送和文档过期的时间。
5.
以下属于HTTP协议的主要特点的是()。
6.
PageRank优先策略常用于()。
7.
DeepWeb爬虫体系结构包含六个基本功能模块和两个爬虫内部数据结构,其中()表示标签/数值集合,用来表示填充表单的数据源。
8.
HTTP请求中的()头域允许客户端指定请求uri的源资源地址,这可以允许服务器生成回退链表,可用来登陆、优化cache等。
9.
HTTP响应中的()指明实体正文的长度,以字节方式存储的十进制数字来表示。
10.
DeepWeb爬虫体系结构中的LVS用于()。
热门答案
1.
以下关于网络爬虫的说法,不正确的是()。
2.
由HTTP客户端发起一个请求,建立一个到服务器指定端口的TCP连接,这个端口默认是()端口。
3.
增量式爬虫中的()指的是:爬虫以相同的频率访问所有网页,不考虑网页的改变频率。
4.
按照()爬取的网页内容根据目录层次深浅来爬行页面,处于较浅目录层次的页面首先被爬行,当同一层次中的页面爬行完毕后,爬虫再深入下一层继续爬行。
5.
网络数据采集一般是通过()或网站公开API等方式从网站上获取数据信息。
6.
HTTP请求中的()方法用于请求服务器删除Request-URI所标识的资源。
7.
GET提交表单时,以()符号分割URL和传输数据。
8.
HTTP请求中的()头域指定请求资源的Intenet主机和端口号,必须表示请求url的原始服务器或网关的位置。
9.
HTTP请求中的()方法用于请求服务器存储一个资源,并用Request-URI作为其标识。
10.
通用网络爬虫通常采用并行工作方式。