
现在很多博主都喜欢用 WordPress 博客程序来给自己搭建一个个人独立博客,而且很多都是新手建的新站,我们在运营网站的时候肯定是希望查看我们当前的网站的运行状态,内容是不是有被搜索引擎抓取。在发表了几篇文章后会经常关注搜索引擎的收录情况,不过很遗憾,搜索引擎都有一个考核期,这样很多新站刚开始的时候就不会被收录,最后就会想,搜索引擎的蜘蛛到底来过没有啊?其实查看蜘蛛来访记录的方法很多,有插件、后台日志查看等,不过最近我收藏了一个用代码来实现的小方法,用过之后感觉还挺好的,所以放在这里和需要的朋友分享一下吧!
下面我给大家记录一下无插件,仅需要几行代码就可以轻松实现查看网站蜘蛛爬行记录。
function get_naps_bot(){
$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
if (strpos($useragent, 'googlebot') !== false){
return 'Googlebot';
}
if (strpos($useragent, 'msnbot') !== false){
return 'MSNbot';
}
if (strpos($useragent, 'slurp') !== false){
return 'Yahoobot';
}
if (strpos($useragent, 'baiduspider') !== false){
return 'Baiduspider';
}
if (strpos($useragent, 'sohu-search') !== false){
return 'Sohubot';
}
if (strpos($useragent, 'lycos') !== false){
return 'Lycos';
}
if (strpos($useragent, 'robozilla') !== false){
return 'Robozilla';
}
return false;
}
function nowtime(){
date_default_timezone_set('Asia/Shanghai');
$date=date("Y-m-d.G:i:s");
return $date;
}
$searchbot = get_naps_bot();
if ($searchbot) {
$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
$url=$_SERVER['HTTP_REFERER'];
$file="robotslogs.txt";
$time=nowtime();
$data=fopen($file,"a");
$PR="$_SERVER[REQUEST_URI]";
fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n page:$PR\r\n");
fclose($data);
}
然后我们将代码插入到当前的主题 Functions.php 文件中,然后我们需要在网站根目录创建一个文件,文件名命名为:robotslogs.txt。
并且需要给予写入的权限。这样,我们可以通过这个 TXT 文本定期检查是不是有蜘蛛爬行记录。我们还可以利用这个日志文件进行可视化数据展现,这个需要用到数据调取方式。
专业提供WordPress主题安装、深度汉化、加速优化等各类网站建设服务,详询在线客服!