如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 网站被人恶意刷流量了导致降权怎么办?

    网站前两天突然流量暴涨很多,我昨天查询发现降权了,是不是被人恶意刷流量导致的降权呢?网站降权后还能不能恢复呢,怎么恢复已经降权的站,有哪些可以恢复正常的,网站真的被降权处理了呢?这样的网站还能不能恢复从前? 回答1:1、恶意刷流量,是否影响到你的网站正常访问,导致打不开,如果打不开,蜘蛛抓取异常,那么会影响你的站点,导致降权;2、如果刷的量并未影响网站稳定性…

    2023年11月9日
    00
  • cn域名到底值得注册使用吗?

    com的域名续费价格这两年一直在上涨,有意换成.cn域名,毕竟价格便宜一半,本来在网上看到很多文章都不推荐.cn的域名,但这些文章很多事10年前甚至20年前的,如果我只是做个人博客的话,现在使用.cn域名可以吗? 回答1:没什么问题啊,cn只是不适合那些违规做站的,因为会被hold。 回答2:国内CN认可度还是挺高的。 回答3:cn不建议注册,太难了,一个是…

    2023年8月9日
    00
  • 已经备案的网站一直不收录怎么办?

    我有一个网站,已经备案了,每天也是稳定更新,但是不更新,是怎么回事? 回答1:现在收录都比较慢,可以试试搜外的蜘蛛池和收录宝,还不错。 回答2:整站不收录,就建议去反馈下,正常反馈了,也就会先放首页出来,内页后期引蜘蛛也会有。 回答3:前期主要是引蜘蛛抓取,抓取的次数多了,收录率也就上去了,如果光有抓取不收录,那基本就是内容质量不够高。 回答4:现在收录很慢…

    2023年11月23日
    00
  • pc收录正常,移动端不收录怎么办?

    大佬们有遇到过,三个月新站移动端不收录的情况么,pc有收录,移动端蜘蛛抓取正常,移动端目前只收录了首页,其他页面一条没收录,不知道是什么问题? 回答1:1、新站收录本身就慢,M站会更慢一些;2、你的M站是PC自适应,还是m.域名呢?这个要具体分析的;3、PC Sitemap和M Sitemap,链接是不一样的,一起提交API;4、新站做好内容,持续稳定更新,…

    2023年10月12日
    00
  • 网站站内优化有用吗?怎么做?

    公司网站被我玩废了,想着从最基础的问题去解决。考虑这样起伏是不是内部优化没有做好? 有大佬会做垂直站内部代码优化的么?最好是性能优化也做掉。 回答1:正常做,这都是百度的问题,买友情、发外链、上竞价等等都可以去做,维护好网站就行。 回答2:1、没有看到域名,无法针对性分析判断;2、站点3个月内连续的起伏比较大,但下跌的周期时间较短又恢复,词库下跌的时候,回顾…

    2023年10月29日
    00
  • 使用CDN怎么防止被攻击巨额欠费怎么办?

    目前打算使用阿里云或者腾讯云的CDN,但是一直担心网站被攻击导致短时间内巨额的欠费。有没有大佬介绍一下经验,怎么设置是比较安全的。欠费可以,一晚上给你欠费几百上千就太蛋疼了。大家有没有好的解决办法? 回答1:打开cc防御,现在每ip,没秒,访问次数,缩小页面大小,购买多个流量包,流量包用完会有短信提醒(发现被攻击直接回源,或者关闭站点)。 回答2:图文分离啊…

    2023年9月20日
    00

发表回复

登录后才能评论