如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 网站服务器打开速度影响seo排名吗?

    前两天网站总是打不开,今天是怎么我的网站有关键词和描述,还有标题啥都有为啥,百度找不到?这是什么情况,出什么问题了,哪里也找不到,求高手指点! 回答1:会有影响,用户体验不好。 回答2:影响特别大,一定要选择速度快,稳定性好的服务器。 回答3:如果是你的网站经常性打不开,肯定会是有很大影响的。但是如果只是打开速度慢,一般是不会影响。 回答4:打不开的站点影响…

    2023年10月11日
    00
  • 百度低质站点怎么判断的?

    我有两个新站,一个有内容(采集站),另一个安装了wp博客差不多3个月了,除了初始化的第一篇几个字的文章,什么内容都没有,两个站都正常,没有被删,那些有权重的老站还被删,怎么判断的? 回答1:也许老站的内容到了一定规模触发了算法,当然也仅仅是猜测。 回答2:凡是大量采集文章的基本都是低质站,百度肯定不喜欢,我看好多大量采集的,最近基本都K了。 回答3:采集的站…

    2023年9月4日
    00
  • 网站上线近2个月了,百度无收录,正常吗?

    上线时间:2023年10月中旬。情况:老域名,没查到黑色历史;有BA;做过了一些外链;一直在更新,一个月100篇左右,伪原创;都有站长提交,有的搜索引擎收录了,但是百度、bing、搜狗,有蜘蛛但没收录。 问题:各位大佬帮我看看可能是什么问题?如果一直这样,该怎么办呢?我怀疑过老域名有问题,需要换个域名吗? 回答1:1、基本正常的,上线超过三个月就不正常;2、…

    2023年11月28日
    00
  • 修改标题导致网站更新不动怎么办?

    网站修改标题标签了,从修改标题标签后网站就不怎么更新,没有任何变化了,怎么回事呢?为什么网站不更新不动了我怎么解决网站恢复过来,有哪些可以优化回来的,可以不让网站继续这样了,我应该怎么处理让网站更新起来呢? 回答1:保持稳定更新,会慢慢恢复的,同时也可在百度资源平台反馈下。 回答2:先看下网站日志,蜘蛛是否正常抓取,不抓取就需要多引蜘蛛。 回答3:没事就不要…

    2023年10月2日
    00
  • 真假百度蜘蛛怎么辨别?怎么看百度蜘蛛?

    最近网站的百度蜘蛛在暴涨,也不知道蜘蛛是真是假所以从网上找了一些测试的方法,看看就好了!要知道Baiduspider绝对不会以匿名的方式抓取网页,因此Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非.baidu.com或.baidu.jp即是冒充。带有baiduspide和crawl.baidu.c…

    2023年9月22日
    00
  • 关键词密度已经超出范围之内太高怎么回事?

    当网站的关键词密度已经太高后,怎么控制关键词密度合理不要继续过高,关键词密度对网站有哪些不利处,平时我们优化应该怎么来控制好关键词密度呢?为什么关键词密度会那么的好高,关键词密度太高和什么有关系呢?我也是刚接手网站不久不太了解怎么办? 回答1:关键词密度太高了,就要删减啊,控制在3%-8%就可以了,不要弄的太多了,不然会容易降权的。 回答2:适当的删减替换一…

    2023年11月19日
    00

发表回复

登录后才能评论