如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 百度提示网站存在风险怎么回事?

    网站优化过程中,发现在百度提示风险,从提升风险之后网站流量也下滑严重,怎么把风险模式取消了,为什么网站会提示风险存在怎么回事,问题是我也没有设置什么,就是有风险呢? 回答1:你网站提示风险肯定是内容出现违规了啊,一般内容违规了才会提示风险,你需要整顿内容,然后去申诉就可以了。 回答2:这种情况基本就是被举报了,先整改网站,再去申诉吧,不然不会通过的。 回答3…

    2023年11月18日
    00
  • 未备案的站影响SEO优化吗?

    网站还没有开启备案,一个没有备案的站影响排名收录情况吗?无备案对SEO优化影响大不大,我的站还没有备案,我要不要开启备案呢?有哪些可以备案的呢?要怎么进行备案比较好,可以快速通过备案,好优化起来一个站对不对? 回答1:今夕非彼,域名当然需要备案之后才好收录。 回答2:会有影响的,还是备一下案吧。 回答3:没有备案的话的确是会影响收录的。 回答4:能备案就备案…

    2023年11月21日
    00
  • 用老域名建站怎样快速收录?

    是这样的,我半个月前买了一个老域名,然后用这个域名做了一个关于美食的站点,现在建站有俩周了,只收了首页,怎样才能快速收录呢? 回答1:A、老域名如果近期有连续多年的建站历史无中断,那么域名信任度高,持续运营一段时间会放出收录;B、老域名新站,也相当于是新站上线,需要引蜘蛛来抓取爬行,内容质量要好,基础优化到位;C、新站上线2周,收录首页,正常,继续优化引蜘蛛…

    2023年8月30日
    00
  • 现在还有必要做seo吗?

    在搜外问答看到有人建议没有绝对技术优势的情况下不要玩SEO,理由是SEO的成本高、见效的时间长、不确定因素多!不得不说,这些情况都是客观存在的,但这不意味着就不能玩SEO了。 SEO技术问题 从某个方面来说,SEO其实没有太多的技术可言,除了搭建网站时要做的那些页面结构、前端设计等,后续更加重要的是生产内容。而生产内容需要的SEO技术不多,掌握基本的SEO文…

    2023年10月14日
    00
  • 百度api提交不收录了吗?

    看到论坛有人说,现在api提交的话,百度不收录了,是不是真的啊,有懂的前辈吗? 回答1:这十条配额根本哪也不到哪,提交的链接都没有反馈。其实我感觉上传链接还是有点用的。 回答2:现在大多数网站只有十条配额了。 回答3:应该没有吧,要不然还出个推送功能干嘛。 回答4:3个网站的10万api全变成10了。 回答5:现在大多数网站都只有十条提交配额了。

    2023年10月23日
    00
  • 腾讯云服务器被攻击咋办?

    腾讯云轻量云服务器被攻击,峰值30GB,总流量50M,被封IP。这种很恶心,没有实力还要攻击,母的就是封你IP。应该怎么办? 回答1:轻云服务器无法更换IP,只能直接升级防御,或者更换服务器,然后用高防CDN隐藏起来。 回答2:套cdn呗,虽然某些大厂的cdn很坑,但是效果还是有的。 回答3:解析国外ip,到127,0,1,现在的解析可以分开国内外的。 回答…

    2023年12月4日
    00

发表回复

登录后才能评论