如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 新站如何避免被搜索引擎惩罚?

    如题:新站如何避免被搜索引擎惩罚? 回答1:不过度优化,采集,违规就行。 回答2:正常优化,不要过度采集,关键词密度要控制好,就没啥大问题。 回答3:新站好好做内容,不用黑帽优化手法,被打击的几率是很小的。 回答4:坚持原创内容,不采集,不用任何作弊手段,最重要的是,运气要好。 回答5:每天稳定更新,一定要做高质量的原创文章,不要采集,要多做外链建设,这样就…

    2023年11月24日
    00
  • 网站注册登录页面需要做robots吗?

    今天看了下网站的流量,发现大部分的流量都是用户登录所致,那么请问这种不做排名的登录页面用不用做robots?我看了网站日志没有发现爬虫抓取这个登录页面的记录,但是用百度抓取诊断这个链接也能抓通。 回答1:没啥影响吧,我看自己网站的登录页面也收录了。 回答2:针对这个Robots可以做两点:a、robots不要屏蔽这个页面的文件及文件夹;b、确保robots里…

    2023年8月25日
    00
  • 网站文章收录少怎么回事?怎么提高网站收录?

    收录少,说明网站蜘蛛来抓取次数是很少的,这个时候要想办法提高网站的抓取频次。 类似上图,一定是要想办法提升抓取频次,收才有可能会增加的,可以尝试以下办法 1、有规律更新内容 内容最好是原创,养成蜘蛛来定期抓取的习惯,可以利用服务器进行自动发布,当然也可以时间自动采集+自动伪原创+定时发布,这是一套完美的解决方案。如果文章内容太多的话,这种方式能给你节约很多时…

    2023年7月25日
    00
  • 网站流量下降厉害怎么补救过来呢?

    网站查询发现流量下降厉害,很多流量越来越少,流量都没有以前多了,我应该怎么优化可以提升流量过来?看到流量下降这么厉害心里特别着急,还能不能恢复从前有什么办法可以补救过来呢?为什么流量这么厉害下降的? 回答1:1、具体站具体分析;2、是被降权,还是误k,自查反馈申诉;3、全标题检索页面还是有效收录,无降权,流量下跌,看哪些词,哪些页面,只要没降权就没问题,降权…

    2023年11月10日
    00
  • 网站被限制索引后应该怎么调整?

    上周五开始索引限制展现,我们属于是资讯网站,转载一些官方文章,现在不知道应该如何处理了,求助各位大佬,还能恢复吗? 回答1:我们的近期也是这种情况,不知道怎么办。 回答2:一周内关键词持续下降,感觉是降权更多一些,就像他们说的反馈也没啥用估计。 回答3:反馈一般都是不符合搜索质量,参考整改。 回答4:1、索引数据未变化,Site域名收录被隐藏;2、内容是采集…

    2023年11月22日
    00
  • 未备案的老域名和新域名收录上有什么区别吗?

    未备案的有建站历史的老域名,和未备案的新域名收录上有什么区别吗?老域名收录会比新域名快吗? 回答1:老玉米厉害,但也不是全部,只是老玉米的几率高很多,所以也看运气,同样是新玉米和老玉米,肯定老玉米做起来的可能性大。 回答2:我新注册的老域名有蜘蛛爬,备案了几天的老域名都没有蜘蛛爬呢。 回答3:备案的域名收录快,没有备案的域名收录慢。

    2023年7月25日
    00

发表回复

登录后才能评论