如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 3线内陆城市,PHP程序员一个月多少工资?

    我想入行IT行业,想咨询一下,3线内陆城市,PHP程序员一个月多少工资? 回答1:没概念,上海13k左右。 回答2:3小城市5000左右?比打螺丝好那么点点。编辑也就3000吧。 回答3:php不能算什么程序员。一个小学文凭的都能自学出来的。这也是很多新的网站不采用php用go的原因了。 回答4:这个吃青春饭的建议不要去做。还不如躺在家里搞几百个网站呢!或许…

    2023年11月19日
    00
  • 网站服务器打开速度影响seo排名吗?

    前两天网站总是打不开,今天是怎么我的网站有关键词和描述,还有标题啥都有为啥,百度找不到?这是什么情况,出什么问题了,哪里也找不到,求高手指点! 回答1:会有影响,用户体验不好。 回答2:影响特别大,一定要选择速度快,稳定性好的服务器。 回答3:如果是你的网站经常性打不开,肯定会是有很大影响的。但是如果只是打开速度慢,一般是不会影响。 回答4:打不开的站点影响…

    2023年10月11日
    00
  • 网站收录但是不参与排名的原因是什么?

    网站收录是网站优化的基础,只有网站被收录了才有获得关键词排名的可能。但是很尴尬的情况就是,网站收录有了,但是没有任何的排名,也就是说网站收录但是不参与排名,这究竟是什么原因呢?本文就给大家介绍下为什么网站有收录但是不参与排名。 1、网站权重低导致收录后不参与排名 比如说新站或者是优化没做好的网站,它们的权重低,基本网站被收录了,或者是其他内容被收录了,但是这…

    2023年11月26日
    00
  • 域名不备案有办法收录并获得好的排名吗?

    用没用备案的域名做了8个网站,域名1个多月来,只有一个收录的,但是没有排名,其他域名基本上都是没有任何动静。然后我试着备案了2个域名,基本上一周就收录,竞争不大的词排面还不错。想咨询下,现在有什么办法不备案域名也能快速收录获得排名的办法? 回答1:我还是有见过不备案案,收录不错的网站。就是时间会比较长一些。这个站你可以去参考一下 。它是没有备案的,但是收录了…

    2023年10月28日
    00
  • ssl证书到期后如何更换?

    网站的ssl证书马上要证书了,到期后需要换免费的,以前是付费的用的,从付费到免费的好不好更换呢?不打算用付费的了,更换多久可以显示出来,看看怎么样付费和免费的?太发愁了,以前都没有自己操作更换过,今天第一次操作所以发愁啊! 回答1:百度站长有免费的,一年为期,可以换上这个。 回答2:阿里云有免费的ssl证书,一年有效期,一年给20个免费名额,你注册一个阿里云…

    2023年10月24日
    00
  • 百度蜘蛛抓取http不抓取https怎么回事?

    我网站是https的,并且在站长平台做了https认证。看了一下网站日志,发现大量抓取http的然后301到https,请问是什么原因导致蜘蛛大量抓取http的呢? 回答1:加不加https都没啥区别。 回答2:这很正常吧,你是不是做了301? 回答3:301到HTTPS,然后站长后台认证,然后等就行了。 回答4:强制重定向除了在服务器上配置301重定向之外…

    2023年11月15日
    00

发表回复

登录后才能评论