如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 如何才能提高资源提交工具的提交配额?

    其实不管是抓取频次还是资源提交配额,其根本还是内容,如果能够持续更新大量优质的内容,这两个问题就都能解决。反之,如果网站更新的内容少,并且还不是优质的,这种情况下,搜索引擎肯定就不会给与好的评价了。 有的朋友总是希望通过投诉或者是反馈来获得加成,这种思维开始就错了!搜索引擎毕竟还是机器的,它会依照既定的规则去调整,而百度搜索也不可能去人工来调整某个网站资源提…

    2023年12月9日
    00
  • 移动端和pc端排名不一致怎么办呢?

    网站都是一样的优化方式,但是移动端比pc端排名要好,怎么处理让pc端排名上去呢?都已经绑定好的,就是想让pc端好点,有什么优化的方式? 回答1:正常吧,很多的都不一样。 回答2:排名不一样才是正常,算法不一样排名本身就不一样。 回答3:出现PC端和移动端关键词排名不一致的情况,由多种原因综合造成。实际上我们网站对自身的评价不能单单以某某一关键词排名作为论断,…

    2023年8月28日
    00
  • 网站被挂马该怎么处理?

    我有一个新闻网站,做了半年多,前几天发现被挂马了,现在已经出现风险了,应该怎么处理呢? 回答1:如果有备份的话直接拿备份替换,如果没有备份的话就找技术帮忙修改找到挂马的页面。 回答2:1、网站被黑,建议找程序,可以写代码,将不存在的URL,返回码变成404,这样,就能提交删除这些垃圾链接;2、目前网站被黑,生产的垃圾页面,域名/?xxxx这种返回码200,备…

    2023年11月19日
    00
  • 怎么删除百度收录的死链接?

    想要让百度删除已经收录的死链,首先得通过站长平台提交死链,这样百度搜索就会自动去处理;如果很长时间还没有处理,可以去站长平台进行投诉,做完这两件事剩下的基本就是等待了。 百度删除死链的速度没有那么快,大家可以耐心等待下。如果死链的数量不大,其实也没有啥影响的,不提交死链、不投诉也没事。但如果思路的数量比较多,比如说沐风博客昨天删除了800+的页面,这相对于整…

    2023年7月25日
    00
  • 网站页面内容重复应该怎么处理好?

    比较好的处理办法就是有选择性的删除,重复内容的页面多了会影响到到整个站点的SEO,可以删除那些没有排名的页面,如果页面内容大部分相同,同时存在少部分的差异,可以把有差异的内容整合到权重高的页面。 网站页面内容重复的影响 理论上说,每个页面的关键词都应该是不同的,同样它的内容也应该有所不同。搜索引擎能够准确的分析出每个页面表述的核心内容,如果多个页面的内容重复…

    2023年10月19日
    00
  • 网站目录和文章页面哪个排名比较快一点?

    从速度上说,文章页面的排名更快,目录页面收录和排名都会慢些,当然前提是文章页面的质量高。 最近大家应该都看到了,在搜索很多关键词的时候,文章页面的排名都很靠前。这是百度搜索机制完善的表现,毕竟用户搜索的很多问题文章页面能更好的解决。 在以前,目录页面的权重相对要高些,在其他条件差不多的情况下,目录页面的排名要比文章页面好。但这些都是过去式了,现在的百度搜索更…

    2023年9月23日
    00

发表回复

登录后才能评论