如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 页面js代码里的内容会影响整个页面关键词的密度吗?

    百度站长平台抓取诊断和模拟蜘蛛工具都无法抓取到js内容,但有很多人说js内容会被抓取到会影响。 所以一个页面js的内容,到底会不会影响关键词密度呢? 回答1:1、你的JS里面是有大量的关键词吗,如果有,这样操作无实际用途;2、虽说可能识别js,但大多数情况都是无法识别抓取,一般不想被抓取到用js;3、这种不会影响关键词密度,能识别抓取到的,才能判断是否密度过…

    2023年10月26日
    00
  • 域名解析a记录和cname记录的区别是什么?

    我们在做域名解析的时候,会看到有几个选择,常见的是a记录和cname记录。很多新手朋友对此不太清楚,本文十九派详细给大家解释下域名解析a记录和cname记录的区别。 A记录:地址记录,用来指定域名的IPv4地址(如:8.8.8.8),如果需要将域名指向一个IP地址,就需要添加A记录。 CNAME: 如果需要将域名指向另一个域名,再由另一个域名提供ip地址,就…

    2023年9月28日
    00
  • 同一台机器不同网站互相影响优化吗?

    同一个台机器,网站内容不同,IP独立,互相影响优化吗? 我做了好几个网站,大致三个行业,都是独立的IP,我准备在上一个站,这样做,会影响优化吗?模板的话大致是两种:dz和WordPress,模板都是一样的。 回答1:独立ip就不会有影响。 回答2:不会有影响的,放心大胆的干吧。 回答3:现在来讲!百度根本不关心这些的! 回答4:这个没影响,之前用的时西北数码…

    2023年8月12日
    00
  • 文章里加二维码对百度收录有影响不?

    我想问一下,我做的教育类型的网站,因为需要业务咨询,所以可能会在网站加上客服板块,但是我想在内页加客服,比如在文章页面加二维码,不知道这样对百度收录有影响吗? 回答1:正常来说,不影响。 回答2:没什么影响,要是怕的话,可以写用JS实时生成,不会在源码里出现二维码了。 回答3:很多论坛的网站不让添加二维码以及联系方式,是担心引流问题,是网站站长的行为,而正常…

    2023年11月12日
    00
  • 有什么办法阻止网站被疯狂扫描采集?

    我想问一下各位大神,有什么办法阻止网站被疯狂扫描采集? 回答1:屏蔽国外IP。或者设置短时间内,某个IP大量链接就封IP。 回答2:把蛛蛛爬虫屏蔽掉。加上水印,加上一些乱码。 回答3:屏蔽所有海外ip,短时间的ip访问,自动封。 回答4:屏蔽IP吧,不然就关站。 回答5:在宝塔面板设置屏蔽IP,你先看看IP段是哪些?如果是国外的,就直接禁止国外访问就行了。如…

    2023年10月30日
    00
  • 网站上线近2个月了,百度无收录,正常吗?

    上线时间:2023年10月中旬。情况:老域名,没查到黑色历史;有BA;做过了一些外链;一直在更新,一个月100篇左右,伪原创;都有站长提交,有的搜索引擎收录了,但是百度、bing、搜狗,有蜘蛛但没收录。 问题:各位大佬帮我看看可能是什么问题?如果一直这样,该怎么办呢?我怀疑过老域名有问题,需要换个域名吗? 回答1:1、基本正常的,上线超过三个月就不正常;2、…

    2023年11月28日
    00

发表回复

登录后才能评论