WordPress教程

利用robots文件降低网络爬虫速度减小压力

阿里云

有些站长经常抱怨自己的网站打开速度很慢,用了各种方法都不起效果。也找不开影响网站打开慢的真正原因。对于我们检测的一部分网站中,有一部分网站打开慢是由于网站被大量网络爬虫频繁的访问造成的。

我们网络爬虫也就是我们 SEO 课程中讲的搜索引擎蜘蛛,我们网站想要在搜索引擎上有排名,第一步就是让搜索蜘蛛抓取我们的网站。但是网络上有大量的垃圾蜘蛛,会肆无忌惮的不停访问我们的网站,这样会给自己的网站服务器增加很大的负担。这时我们需要降低网络爬虫速度减小压力。

降低网络爬虫速度的方法很简单,在 robots.txt 文件里就可以通过代码来降低速度。

也想出现在这里?联系我们
创客主机
  1. User-agent: *
  2. Crawl-delay: 10
  3. Request-rate: 60/1m
  4. Visit-time: 0000-0800

由于这个还没有完全的标准,两种都用了,Crawl-delay 是每秒访问的网页数,而 Request-rate 是页面数/时间段,可以设置为比较小的值,Visit-time 为允许访问的时间段。

当然,我们也可以把一些常见的垃圾蜘蛛屏蔽掉,不让他们来抓取我们的网站。方法见:

网站怎么彻底屏蔽拦截搜索引擎蜘蛛爬虫抓取 做网站优化的站长都知道,网站上线后,网络上会有很多的搜索引擎蜘蛛爬虫会访问我们的网站。这些搜索引擎蜘蛛爬虫中既 […]
日期:2022/2/12 阅读:2115阅读全文

利用 robots 文件降低网络爬虫速度减小压力

已有 408 人购买
查看演示升级 VIP立刻购买

收藏
(0)

发表回复

热销模板

Ashade - 作品展示摄影相册WordPress汉化主题
LensNews

本站承接 WordPress / PbootCMS / DedeCMS 等
系统建站、仿站、开发、定制等业务!