如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 百度未收录的内容还可以收录吗?

    理论上说是有机会的!百度搜索对于页面的收录判断不是一次,后面还会对内容进行审核,对于那些符合要求的内容还是会收录的,尤其是新站,很多内容其实已经被百度收录了,只是还没有放出来。 这是十九派的页面收录情况,通常都会在24小时内收录。当然,十九派的内容基本都是原创文章,并且还有快速收录权限,所以基本不用担心收录问题。 之前十九派也曾经测试过,某些页面在短时间内的…

    2023年11月11日
    00
  • 百度提示过的低质量网站还会收录吗?

    会收录,但对于页面的质量要求会更高些,站点被提示为低质站点,也只是目前为此的情况,百度不会因此而歧视站点后续更新的内容,但是因为站点权重被降低,后续的蜘蛛爬行和页面收录可能没有那么快! 这里要分清除第一次收录和后续考核后的收录。百度第一次收录的要求没有那么严格,就比如那些垃圾采集网站,虽然采集的都是垃圾内容,但百度还是会收录。但在后续的时间里面,百度会多次对…

    2023年11月20日
    00
  • 网站不收录,蜘蛛不抓取怎么回事?

    最近新上线的站都不收录了,百度蜘蛛也不抓取,怎么回事? 回答1:1、新上线网站短时间不收录是正常的;2、可以做快收。 回答2:1、新站上线,前期不收录也正常,如有备案,首页不收录,无违规作弊,直接申诉反馈,请求放首页,正常7-30天首页会放出;2、自查有无问题,无问题,抓取无异常,可申诉,新站收录不稳也正常,持续运营优化即可。 回答3:新站一般需要3个月后才…

    2023年12月11日
    00
  • 索引量0是怎么回事?

    之前是上万的索引量,现在的索引量越来越少,今天查询看到索引量是0,太惊讶了那么多索引量都是上万了,为什么索引量减少厉害,这么一点呢?索引量的问题让我纠结,其实网站别的问题都没事是正常,就是索引量变化无常让人担心,我要不要在意索引量? 回答1:检查并优化网站的SEO设置,确保符合搜索引擎的规则。将动态链接改为静态链接。提交网站地图,增加蜘蛛爬行和收录的机会。 …

    2023年10月19日
    00
  • 友情链接会不会导致被降权?

    少数友链出问题不会导致站点被降权,但如果导出的链接指向的站点都有问题,那这些友链可能就会影响到到自身站点。 很多人每天都会去检查下,看看站点的友链在不在,或者看这些友链站点是否有被降权的嫌疑。其实完全没有必要这样做,友情链接对于站点的影响没有那么大,搜索引擎不会因为几个友链有问题(友链站点打不开,或者友链站点被降权),就去惩罚站点。 很多时候,我们的担心不过…

    2023年9月17日
    00
  • wordpress的seo策略都有哪些?

    最近学习wordpress的源码,请教一些问题。 1.wordpress坚持内链是绝对URL(织梦则不是),是否绝对路径确实效果要好于相对路径? 2.wordpress的图都是和标题一样的alt、title标签,不会造成堆砌? 3.og标签是否对SEO有效果,但wordpress我看只用了og:type标签,是这个最重要? 4.wordpress还用了art…

    2023年11月5日
    00

发表回复

登录后才能评论