如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • apache和nginx哪个好?

    我想请教大佬们一个问题。事情是这样的:apache就是伪静态很方便适合动态的。nginx适合静态很快,我现在就是用的nginx但是好多模板搞伪静态老是出问题,所以我现在很头疼,真的不知道apache和nginx哪个好?有大家知道吗? 回答1:根本不需要折腾,直接用lnmp.org安装的时候,选择安装LNMPA=LINUX+NGINX+APACHE+PHPMY…

    2023年8月10日
    00
  • 如何让百度秒收录?

    没有什么方法能够保证百度秒收录,即便是那些权重高的大站,也不能做到都秒收录,建议大家不要把收录的速度看得那么重,因为这涉及到很多方面的因素,不是解决单个问题就能搞定的。 理论上说,权重高的网站页面收录的速度会快,但是收录快的网站不等于权重就高。 我们做网站优化不能仅仅盯着页面收录的速度,百度方面也明确表示,一个星期内收录都是正常的,对于那些权重低的网站,尤其…

    2023年10月26日
    00
  • 百度api提交不收录了吗?

    看到论坛有人说,现在api提交的话,百度不收录了,是不是真的啊,有懂的前辈吗? 回答1:这十条配额根本哪也不到哪,提交的链接都没有反馈。其实我感觉上传链接还是有点用的。 回答2:现在大多数网站只有十条配额了。 回答3:应该没有吧,要不然还出个推送功能干嘛。 回答4:3个网站的10万api全变成10了。 回答5:现在大多数网站都只有十条提交配额了。

    2023年10月23日
    00
  • 有收录无索引是什么原因?

    我有一个网站是有收录了,差不多500多,但是没有索引量,我在百度站长后台查了,也没有索引量,是怎么回事?什么原因? 回答1:没有关键词排名展现吧,也就是没有流量的页面。 回答2:收录—索引—排名 先收录在索引,一般的情况下,可能是因为时间问题,还没有被百度放入索引库,还有就是收录只是爬取到有这个页面,进行收录,但是页面质量差,非原创等等原因,导致该篇文章无法…

    2023年11月5日
    00
  • 网站排名一直在第四页,有什么办法靠前吗?

    公司正规网站,不敢乱发,想问问,现在有没有好的技巧提升排名?我们公司网站的排名不好,一直都是第四页,第五页这样,每天也是照常更新,就是不上去。怎么办? 回答1:那就只能从内容上面着手了,最好原创文章。 回答2:做好的内容,不断更新高质量内容。 回答3:每天多更新一些高质量的文章,慢慢词库数量上去了,权重也慢慢上去了。 回答4:只能是通过长尾词来获取较好的排名…

    2023年11月2日
    00
  • 网站品牌词一夜之间暴跌怎么回事?怎么办?

    网站平时正常更新原创维护,网站没有备案,所有关键词和品牌关键词一夜之间全部消失,但是网站也一直在收录,蜘蛛反而比以前增多,请问这是什么原因了,有什么方法能快速恢复品牌词了。品牌没有什么竞争对手。 回答1:1、所有关键词和品牌词都掉了,那么说明站点网页,现在是变无效收录,全标题不在第一,如果页面变无效收录,词库掉也是正常;2、回顾操作,有无被黑 违规作弊 误操…

    2023年10月20日
    00

发表回复

登录后才能评论