如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 百度竞价推广费可以退吗?

    网站参加一周后,可以退费取消推广吗?那样对网站有没有什么影响,就是加入竞价推广后不想继续参加了,有什么可以取消的呢?因为我的新站感觉必要参加了,觉得效果不理想,应该怎么办? 回答1:可以退,但是流程会繁琐,不太好退。 回答2:可以退,找客服就行了。 回答3:不能退费,可以换成其他的。 回答4:A、百度推广不分新老站,上线按点击扣费;B、而且前期也都是推基木鱼…

    2023年9月1日
    00
  • 被百度认为网站整体质量低怎么办?

    我想请教大家一个问题,被百度认为网站整体质量低,把低质的文章删除提交404,还是继续坚持更新高质量文章? 回答1:只能换个域名,换个网站了,怎么改都不行。 回答2:不多可以删掉,多的话,删掉部分,多更新高质量文章即可。 回答3:扔两月就恢复了,如果你没恢复就当我没说。 回答4:账号实名,然后,你提交复审,就这样等着就行。 回答5:愿意等的话慢慢更新高质量的,…

    2023年10月14日
    00
  • seo实训总结及心得体会

    刚开始做的时候啥都不会,一直都是自己研究和记录心得,也一直去动手实践,可以是经历了很长的一段学习时间吧,一直都是混各地SEO论坛和研究效果,走了很多歪点,开始做的时候确实很害怕,一直都是很低调,后来有人带了服务器及域名选购后,也慢慢开始大胆的放心去做了,中途着了很多服务商的坑,要么跑路要么把你服务器关了,也导致损失过很多流量,也一直重做了很多次,在钱财方面更…

    2023年7月25日
    00
  • 运行堵塞经常100%,网站后台打开很慢怎么办?

    运行堵塞经常100%,网站后台打开很慢,之前还不会,今天打开一看就这样了,Wordpress的,一个网站12万文章,一个10万。我想请教一下大家,应该怎么办? 回答1:看网站日志和mysql日志和php日志。 回答2:是你程序太臃肿了,换个程序试试,如果换了程序就正常,那就决绝问题了。如果换了程序,还是如此,说明访问量大导致,就该升级服务器配置了。 回答3:…

    2023年9月17日
    00
  • 网站降权怎么恢复?(分享下我的网站降权恢复经验)

    月初的时候发现网站关键词排名和流量突然大幅度下降,一看就是降权的趋势,吓得我在论坛里发了好几篇帖子询问各路大佬。目前网站数据已经恢复。 下面说下我采取的恢复方法,供大家参考。 首先是找到网站降权的原因,重点分析网站日志,资源平台。像我的网站,查看资源平台发现服务器存在大量抓取错误,分析前几天的网站日志,当天网站几乎全是502。 根据时间推断是服务器问题导致的…

    2023年8月1日
    00
  • 百度收录页面所有内页标题关键词描述全部是首页?

    百度收录内页所有内页全部都是首页标题,而且内页文章标题都是正常tdk设置没有什么问题,请问那个大神能知道是什么原因? 回答1:这是百度抓取问题,不用理会。 回答2:是调用出错,还是被黑了,你抓取看看。 回答3:1、蜘蛛模拟抓取爬行下,抓取诊断下,看看蜘蛛抓取的标题是否是正常的标题;2、如果蜘蛛抓取模拟抓取的都是一样标题,说明站点存在问题,如果以前都是正常的,…

    2023年10月9日
    00

发表回复

登录后才能评论