如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 淘宝的蜘蛛池有效果吗?

    昨天在淘宝买了个一块钱的体验套餐蜘蛛池,今下午两点半到现在就开始几分钟来几个百度蜘蛛,但是不知道是不是蜘蛛池的功劳,上午的时候向百度反馈了不收录,下午就来蜘蛛了。所以,我想问:淘宝的蜘蛛池有效果吗? 回答1:你要看访客IP 不是UA,很多都是假的,还会告诉你7天后向他要数据,其实7天后淘宝自动提交评价,无法申请退款。 回答2:有卵用,没有100W+的蜘蛛都不…

    2023年10月23日
    00
  • 最近百度不爬我的站的新内容,请问这是怎么回事啊?

    如题,最近百度不爬我的站的新内容,请问这是怎么回事啊? 回答1:多更新一下原创文章,高质量的原创文章,不要采集,也不要复制! 回答2:看看有没有降权,正常的话等等看,搜索引擎可能有的时候收录会慢些,看索引有没有波动变化。 回答3:提高一下内容的质量度,可以做一下站内的链接,用收录的页面带动一下。 回答4:是不是新内容没有什么吸引力? 回答5:更新太少了,一天…

    2023年12月5日
    00
  • 网站被降权加友情链接会怎么样?可以恢复吗?

    我的网站前段时间降权了,但是收录36000多,排名关键词都是50页以外!加友情链接有用不? 回答1:有用的,链接到关键词对应的内页。 回答2:没有,我现在就在经历,三个月还没有恢复回来呢。 回答3:友情链接不是越多越好,最好也别弄一样的字。 回答4:只要不是严重违规,3个月内必恢复。轻的一个礼拜,然后1个月,2个月,3个月,如果3个月没恢复,你得好好排查网站…

    2023年8月9日
    00
  • 蜘蛛不爬取页面是什么原因造成的?

    蜘蛛最近就是不来网站爬取页面,长时间都两个星期没有见到蜘蛛的痕迹,是什么原因导致的蜘蛛不来网站爬取页面,一次次的也没有看到蜘蛛的痕迹,为什么蜘蛛不来网站抓取或者访问了呢?网站没有蜘蛛,怎么引导蜘蛛呢? 回答1:Robots有没有屏蔽蜘蛛,内容质量差或者站点质量不佳。 回答2:页面内容不佳,可以适当使用外链及蜘蛛池。 回答3:想要吸引蜘蛛就发布好的纯手写新文章…

    2023年9月17日
    00
  • 有收录无索引是什么原因?

    我有一个网站是有收录了,差不多500多,但是没有索引量,我在百度站长后台查了,也没有索引量,是怎么回事?什么原因? 回答1:没有关键词排名展现吧,也就是没有流量的页面。 回答2:收录—索引—排名 先收录在索引,一般的情况下,可能是因为时间问题,还没有被百度放入索引库,还有就是收录只是爬取到有这个页面,进行收录,但是页面质量差,非原创等等原因,导致该篇文章无法…

    2023年11月5日
    00
  • 网站不收录怎么回事?怎么办?

    百度拒绝收录,正常备案的企业站,百度死活收录为0,连一条收录都不给,最搞笑的是百度站长后台索引还在不断增加。每次反馈给出的理由就是不符合搜索引擎体验,但是网站就这么大,查到崩溃也没看出来,到底是哪个体验会导致百度连一条收录都不给,连首页收录都不给,死活都想不明白,连360这死活不收录的平台收录量都在涨,唯有百度死活收录0。希望各位大神帮忙看看,感谢感谢。 回…

    2023年10月27日
    00

发表回复

登录后才能评论