如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 谈谈SEO培训方面的一些看法

    之前有看坛子里面好一部分发有关SEO培训的主题,还有的人针对培训机构或者个人进行了一些评价,其中不乏还列出了排名,做SEO基本就是白帽和黑帽,白帽一般都是国内一些网站的常规优化,黑帽其实稍微资深一些的SEO也知道,刚开始有接触杰瑞,后来也有接触附子,再后来就是逆冬,学费基本上都是8000起步,要说学呢,其实,也不能单纯只靠老师教,更多的还是需要个人去领悟和实…

    2023年7月25日
    00
  • 网站长期不更新是什么结果?会降权吗?

    如果该行业的产品和资讯基本不用更新,那么网站长时间不维护也没问题,如果行业本身经常会有新的产品或者资讯、问题出现,网站长时间不更新就可能受到影响。 原则上,搜索引擎还是建议网站保持持续更新,因为用户的搜索需求会变化,所以站点需要持续帮助用户解决问题。如果网站长期不更新内容的话,很明显就不能更好的满足用户需求,这就可能导致网站被降权。 要知道,做SEO就好比逆…

    2023年7月25日
    00
  • 用户体验化对seo影响大吗?

    用户体验化对SEO影响大不大,怎么把一个网站的用户体验化做好,提升用户体验我们需要怎么进行做,有哪些可以做用户体验化,用户体验化对一个网站是不是重要,怎么更好的设置好用户体验化,一般是是做的呢?多谢各位高手指导感谢! 回答1:有影响,非常大,但是也不需要过于关注,正常设计网站就好。 回答2:用户体验化对seo影响很大。 回答3:太大了,不管是做啥用户体验都是…

    2023年9月19日
    00
  • 新网站如何快速被收录?

    新网站如何快速被收录?关于这个问题是许多朋友在做新站遇到的问题,那么本篇文章就为大家总结解答一下新网站如何快速被收录的相关知识。 1、网站服务器要稳定 如果网站的服务器不稳定会导致网站时不时的无法正常打开,或者是打开速度太慢,长期这样的话摆渡蜘蛛就会对我们的网站失去兴趣。更重要的是,不稳定的服务器容易让摆渡惩罚这个服务器IP,这样就会导致网站也一起被摆渡屏蔽…

    2023年7月25日
    00
  • 网站注册登录页面需要做robots吗?

    今天看了下网站的流量,发现大部分的流量都是用户登录所致,那么请问这种不做排名的登录页面用不用做robots?我看了网站日志没有发现爬虫抓取这个登录页面的记录,但是用百度抓取诊断这个链接也能抓通。 回答1:没啥影响吧,我看自己网站的登录页面也收录了。 回答2:针对这个Robots可以做两点:a、robots不要屏蔽这个页面的文件及文件夹;b、确保robots里…

    2023年8月25日
    00
  • 为什么网站一直没有索引量呢?网站没索引怎么解决?

    索引量是百度纳入索引库的数据,目前来看这个索引量数据的展示存在延迟的现象,大家可以具体看看显示的日期。这里的日期最新的应该昨天,如果显示的时间是昨天,而索引量没有数据,那就只能说明网站页面还没有百度纳入索引库。 另外除了日期上的延迟,索引本身也存在延迟。我们有时候会发现,用site命令查询能看到网站被收录的页面,但是在索引里看到的数据确实0。如果你的网站一直…

    2023年8月23日
    00

发表回复

登录后才能评论