首页
深度优先的爬行策略可以避免遇到一个无穷深层分支时无法结束爬行的问题。
精华吧
→
答案
→
远程教育
→
国家开放大学
深度优先的爬行策略可以避免遇到一个无穷深层分支时无法结束爬行的问题。
A.正确
B.错误
正确答案:B
Tag:
分支
深度
策略
时间:2023-11-20 10:15:44
上一篇:
广度优先的爬行策略按照深度逐层爬行页面,所有链接遍历完后,爬行任务结束。
下一篇:
HTTP请求中的User-Agent表示发起请求的客户端类型。
相关答案
1.
深度优先爬行策略的不足之处在于需较长时间才能爬行到目录层次较深的页面。
2.
GET方法请求服务器删除Request-URI所标识的资源。
3.
GET方法提交表单数据,会带来安全问题。
4.
HTTP响应中的ETag用于把cookie发送到客户端浏览器。
5.
判断题:GET方法可以在Request-URI所标识的资源后附加新的数据。
6.
一次HTTP由一次请求(Request)和一次响应(Response)组成。
7.
HTTP响应中的Content-Language用于WEB服务器告诉浏览器自己响应的对象所用的自然语言。
8.
一般计算机只要处理结构化数据。
9.
HTTP的响应包括Content-Encoding、Content-Length、Content-Type等。
10.
小的网站将没有爬虫访问。
热门答案
1.
HTTP请求的POST方法请求服务器存储一个资源,并用Request-URI作为其标识。
2.
网络爬虫抓取各种资源后,通过相应的索引技术组织这些信息,提供给用户进行查询。
3.
HTTP状态码500表示由于客户端原因造成的请求失败。
4.
聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。
5.
DeepWeb爬虫爬行过程中表单填写的方法有()。
6.
增量式网络爬虫的体系结构包含()等。
7.
HTTP请求的GET方法请求获取由Request-URI所标识的资源的响应消息报头。
8.
广度优先策略不能避免遇到一个无穷深层分支时无法结束爬行的问题。
9.
深度优先策略比较适合垂直搜索或站内搜索,但爬行页面内容层次较深的站点时会造成资源的巨大浪费。
10.
HTTP状态码500表示由于服务器原因造成的请求失败。