如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 页面js代码里的内容会影响整个页面关键词的密度吗?

    百度站长平台抓取诊断和模拟蜘蛛工具都无法抓取到js内容,但有很多人说js内容会被抓取到会影响。 所以一个页面js的内容,到底会不会影响关键词密度呢? 回答1:1、你的JS里面是有大量的关键词吗,如果有,这样操作无实际用途;2、虽说可能识别js,但大多数情况都是无法识别抓取,一般不想被抓取到用js;3、这种不会影响关键词密度,能识别抓取到的,才能判断是否密度过…

    2023年10月26日
    00
  • 网站更新文章后也没有变化怎么回事?

    一直保持网站更新,从没有隔段开更新这些天是怎么了,网站更新了很多文章,但是依然没有变化,文章没有被收录了,也没有更新变化都是自己的原创文章,怎么就没有变化,是不是与没有备案有关,我的站还没有备案,这个关系大不大怎么处理呢,真的必须要备案吗? 回答1:保证内容的质量度,定期向百度后台提交链接,效果会比较慢,需要长期坚持。 回答2:是不是被降权或者K站了。 回答…

    2023年11月15日
    00
  • apache和nginx哪个好?

    我想请教大佬们一个问题。事情是这样的:apache就是伪静态很方便适合动态的。nginx适合静态很快,我现在就是用的nginx但是好多模板搞伪静态老是出问题,所以我现在很头疼,真的不知道apache和nginx哪个好?有大家知道吗? 回答1:根本不需要折腾,直接用lnmp.org安装的时候,选择安装LNMPA=LINUX+NGINX+APACHE+PHPMY…

    2023年8月10日
    00
  • 服务器ip突然就连不上了怎么回事?

    一开始是宝塔面板无法访问,然后用finalshell也连不上服务器。换了邻居的电信WiFi联网,宝塔能正常访问,服务器也能正常连接了。我又换回自己的宽带跑ping,看着也正常。 回答1:我也遇到过,过了一段时间就又好了。 回答2:中间某个节点网络出现波动,你这香港的服务器,为啥跑的还有局域网,这就是个很奇怪的事情。 回答3:中间还出现日本的节点。这是清洗去了…

    2023年11月5日
    00
  • 火车头采集文章怎么把文章标题缩短?

    使用火车头采集文章,采集过来的文章标题太长后,如何把文章标题缩短呢?为什么文章标题采集的时候不能缩短,那么采集无法设置,是不是动手可以设置标题缩短呢?火车头刚刚使用,不太了解麻烦各位大神们指导下感谢! 回答1:手动修改一下,把重复的内容替换。 回答2:这个要看你的采集的标题长的内容是什么,如果是文章标题后面跟的是网站名字,那你可以在标题那有个内容替换,把重复…

    2023年9月3日
    00
  • 网站搜索标题搜不到怎么回事?

    我有一个网站,是做美文的,每天都是在坚持更新的,而且都是原创文章,但是我突然发现标题搜不到,全网都搜不到,这个是怎么回事? 回答1:1、搜索域名能在首页不,如果在,影响就不大;2、如果搜索不到,可能是降权了;3、内页有收录,是WWW的,还是无WWW的,可以分开判断降权的是哪个。 回答2:因为网站权重不够,所以没有排名搜索不到。 回答3:1、网站收录正常,就是…

    2023年11月16日
    00

发表回复

登录后才能评论