如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 百家号撤回作品会不会扣分处理?

    百家号当文章作品有误会的时候,撤回文章作品编辑后继续使用,这样还会不会扣分处理呢?有哪些可以编辑作品不容易被惩罚扣分处理?是昨天发布的作品,有点问题需要撤回来编辑后还能使用吗?会对作品有哪些不利处呢?我应该怎么办? 回答1:不会被扣分,撤回就没有流量了。 回答2:撤回百家号不会被扣分的。 回答3:A、百家号无问题的文章撤回不会扣分,但如果提示有问题已扣分,撤…

    2023年10月1日
    00
  • 百度未收录的内容还可以收录吗?

    理论上说是有机会的!百度搜索对于页面的收录判断不是一次,后面还会对内容进行审核,对于那些符合要求的内容还是会收录的,尤其是新站,很多内容其实已经被百度收录了,只是还没有放出来。 这是十九派的页面收录情况,通常都会在24小时内收录。当然,十九派的内容基本都是原创文章,并且还有快速收录权限,所以基本不用担心收录问题。 之前十九派也曾经测试过,某些页面在短时间内的…

    2023年11月11日
    00
  • 未备案的老域名和新域名收录上有什么区别吗?

    未备案的有建站历史的老域名,和未备案的新域名收录上有什么区别吗?老域名收录会比新域名快吗? 回答1:老玉米厉害,但也不是全部,只是老玉米的几率高很多,所以也看运气,同样是新玉米和老玉米,肯定老玉米做起来的可能性大。 回答2:我新注册的老域名有蜘蛛爬,备案了几天的老域名都没有蜘蛛爬呢。 回答3:备案的域名收录快,没有备案的域名收录慢。

    2023年7月25日
    00
  • 新网站要被百度收录需要多少天?

    我最近上线了一个网站,现在都半个月了,首页还没有收录,真的是很奇怪,我怎么更新都不行,尝试了各种办法,就是不见收录,有没有大神知道这是为什么?新网站要被百度收录需要多少天? 回答1:看内容和质量,1-3个月吧。 回答2:快的话10来天,慢的话三个月,半年都有可能。 回答3:不好说,估计时间可能是一周左右。 回答4:A.已备案网站,在内容填充好,确认没有空短页…

    2023年9月20日
    00
  • 网站描述中没有布局的关键词怎么进行优化?

    就网站优化来说,页面标题、页面关键词和页面描述都是很重要的,尤其是页面标题,搜索引擎判断页面跟用户搜索词的相关性,首先会去分析页面标题。因此,如果tdk中没有布局关键词,建议不要强行去优化排名。如果是在想要优化某个关键词,可以考虑在tdk里面加上,最起码要在标题里面出现。那么既不能加又想优化,应该不怎么办呢?唯一的方式就是通过外部优化来当成目标了,比如弄些友…

    2023年11月26日
    00
  • 同服务器网站互相跳转怎么办?

    如图,服务器里面只有一个站部署了https,但是访问其他站如果加上https,打开的就是部署https的那个网站,这是为什么呢?要怎么解决呢? 回答1:宝塔里面有“HTTPS防窜站”,看看这个开启没有,再试试。 回答2:这是域名通过宝塔部署后,默认 部署到了服务器IP上,访问任何带443端口的域名/IP 都跳这个站,解决方法比较多,比如设置一张假证书设为默认…

    2023年10月13日
    00

发表回复

登录后才能评论