如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 网站不收录,蜘蛛不抓取怎么回事?

    最近新上线的站都不收录了,百度蜘蛛也不抓取,怎么回事? 回答1:1、新上线网站短时间不收录是正常的;2、可以做快收。 回答2:1、新站上线,前期不收录也正常,如有备案,首页不收录,无违规作弊,直接申诉反馈,请求放首页,正常7-30天首页会放出;2、自查有无问题,无问题,抓取无异常,可申诉,新站收录不稳也正常,持续运营优化即可。 回答3:新站一般需要3个月后才…

    2023年12月11日
    00
  • 百度蜘蛛不来网站抓取页面怎么回事?

    最近是什么情况,百度蜘蛛不来网站抓取页面了,百度蜘蛛不来网站了怎么吸引蜘蛛来到,让蜘蛛更好的来网站抓取页面,蜘蛛不来了收录量就停止了,怎么解决蜘蛛的问题呢?为什么蜘蛛长时间不过来,是网站出问题了吗?纠结咋处理呢? 回答1:检查下网站有无被搜索降权,都正常的话多引蜘蛛。 回答2:蜘蛛不来,很大原因是网站并没有被蜘蛛发现,那么,怎么让蜘蛛发现呢? 蜘蛛发现网站渠…

    2023年9月28日
    00
  • 百度未被收录的文章怎么处理好些?

    百度没有收录我的文章,是我的文章质量不够好,还是什么原因导致的没有被收录多少,旧文章越来越积极太多,有什么办法可以补救过来,让我的文章被收录还有机会收录吗?怎么处理是编辑还是删除了,以前未收录的文章,这些还是有用的。 回答1:修改一下重新提交收录。 回答2:不用刻意的去处理,没有收录先不用管,如果长期实践没有收录,那就检查一下,是不是文章质量有问题,也可以给…

    2023年10月12日
    00
  • 网站优化过度导致哪些不利处?怎么避免?

    网站优化过度会导致什么问题,如何避免网站优化度过,为什么会有优化过度呢?当优化过度了,怎么处理解决呢?网站之前是平稳的,我怕优化会过度太高,怎么更好的避免呢? 回答1:过度优化,我是觉得没有标准的,我现在就是锚文本做内链。 回答2:别刻意堆砌关键词,控制好关键词密度就好,优化过度还可能会被降权。 回答3:控制好关键词密度,不要太多。 回答4:标题不要堆砌关键…

    2023年11月13日
    00
  • 网站注册登录页面需要做robots吗?

    今天看了下网站的流量,发现大部分的流量都是用户登录所致,那么请问这种不做排名的登录页面用不用做robots?我看了网站日志没有发现爬虫抓取这个登录页面的记录,但是用百度抓取诊断这个链接也能抓通。 回答1:没啥影响吧,我看自己网站的登录页面也收录了。 回答2:针对这个Robots可以做两点:a、robots不要屏蔽这个页面的文件及文件夹;b、确保robots里…

    2023年8月25日
    00
  • 排名刚起来的网站换服务器影响大不大?

    换服务器对网站肯定是有影响的,蜘蛛要适应新的网站服务器,这里面有个过程。对于刚起来的网站来说,十九派不建议更换服务器,尽量还是等到网站比较稳定之后再去更换。 相信大家都使用过百度搜索的抓取诊断,很多时候会出现不能解析的情况,尤其是刚上线的新站,更是经常遇到这样的问题。为什么会出现这样的问题呢,主要原因当然是百度搜索,但客观上服务器也有一定的影响。所以,如果更…

    2023年11月6日
    00

发表回复

登录后才能评论