如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 网站被别人采集怎么办?禁止ip有用吗?

    被某个网站采集的话,查询一下这个网站的ip地址,然后设置这个ip禁止访问,这样是否有效果呢? 回答1:真采集的,不会只用那个ip,而且你封一个,附近区域的都可能封了。 回答2:有些人会,把程序架到本地,采集完了,再同步到网站上! 回答3:我家里电脑自动采集的,第二天路由重启,IP自动换了。 回答4:网站被人采集,禁止ip没用的,人家可以切换无数个IP,所以你…

    2023年8月11日
    00
  • 怎么删除百度收录的死链接?

    想要让百度删除已经收录的死链,首先得通过站长平台提交死链,这样百度搜索就会自动去处理;如果很长时间还没有处理,可以去站长平台进行投诉,做完这两件事剩下的基本就是等待了。 百度删除死链的速度没有那么快,大家可以耐心等待下。如果死链的数量不大,其实也没有啥影响的,不提交死链、不投诉也没事。但如果思路的数量比较多,比如说沐风博客昨天删除了800+的页面,这相对于整…

    2023年7月25日
    00
  • www修改成其他二级域名,对蜘蛛爬取有影响吗?

    www.jiupaicom.com,网站本来是这样解析的,首页一直不收录,但是百度收录m端页面,于是就把www改成了abc.jiupaicom.com 这样做首页,百度终于收录首页,但是m页面又一直不收录。 这几天完全不收录了,坑,早知道不修改了,之前好歹收录m,还给排名,现在完全不收录了。 大家有没有这样操作过啊?像我这种情况 要怎么抢救下? 回答1:继续…

    2023年8月5日
    00
  • 网站修改TDK后怎么让关键词有排名?

    最近网站修改了TDK,但是搜索关键词却没有排名,我都是每天在更新的,而且是原创的文章,就是没有排名,有大佬知道为什么吗?怎么让关键词有排名? 回答1:网站修改TDK后希望获得排名,请执行以下操作:A.检查是否根据百度《网页质量白皮书》中的“网站设置”类进行设置的。B.观察日志是否抓取已修改页面。C.静静等待。ps:修改TDK会发生一些情况,比如搜全标题搜不到…

    2023年10月3日
    00
  • 百度低质站点怎么判断的?

    我有两个新站,一个有内容(采集站),另一个安装了wp博客差不多3个月了,除了初始化的第一篇几个字的文章,什么内容都没有,两个站都正常,没有被删,那些有权重的老站还被删,怎么判断的? 回答1:也许老站的内容到了一定规模触发了算法,当然也仅仅是猜测。 回答2:凡是大量采集文章的基本都是低质站,百度肯定不喜欢,我看好多大量采集的,最近基本都K了。 回答3:采集的站…

    2023年9月4日
    00
  • 淘宝的蜘蛛池有效果吗?

    昨天在淘宝买了个一块钱的体验套餐蜘蛛池,今下午两点半到现在就开始几分钟来几个百度蜘蛛,但是不知道是不是蜘蛛池的功劳,上午的时候向百度反馈了不收录,下午就来蜘蛛了。所以,我想问:淘宝的蜘蛛池有效果吗? 回答1:你要看访客IP 不是UA,很多都是假的,还会告诉你7天后向他要数据,其实7天后淘宝自动提交评价,无法申请退款。 回答2:有卵用,没有100W+的蜘蛛都不…

    2023年10月23日
    00

发表回复

登录后才能评论