如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 网站国内搜索引擎不收录怎么办?

    google、bing、百度搜索引擎,都已收录,为何国内搜索引擎360、神马、头条、搜狗不收录网址呢,大家看看有什么问题? 回答1:360、搜狗反应会慢一些的。 回答2:1、有无备案,无备案前期收录周期漫长;2、查看域名历史,有无违规历史,无违规历史,尝试引蜘蛛,提交或反馈,来看看是否可加快蜘蛛抓取和收录。 回答3:不是域名的问题,搜狗,360等这些就是这样…

    2023年11月25日
    00
  • 如何分析竞争对手的网站数据呢?

    怎么分析网站的一些数据,看看竞争对手的站如何怎么样,有哪些可以分析的方法,分析竞争对手的站我们怎么做?因为竞争对手的站总是比我的排名要高很多,我想查询看看怎么样,对方是怎么优化的为什么总是比我的要高? 回答1:A、桔子seo查看域名得分,历史建站;B、Site域名,随机检索,有效收录量;C、第三方站长工具综合查询;D、想要获取准确的,需有内部账户。 回答2:…

    2023年10月1日
    00
  • 全站除了首页外都是无效收录,是被算法打击了吗?

    我的站点除了首页之外,文章搜索标题都没有排名,是不是被算法打击了,以前的低质量内容要不要删掉? 回答1:搜索全标题匹配出来的截图发来好分析,单纯搜索标题不在首页,不完全代表是无效收录的。 回答2:有没有可能内容质量没做好导致无效收录。 回答3:先不要删、略微修改一下。 回答4:1、如果先前检索全标题都是首页,后期排名掉,内页排名都没了,全标题也检索不到,那么…

    2023年12月1日
    00
  • 聚名的金牌账户有必要开吗?

    聚名的金牌账户有必要开吗?抢注竞价域名,能折价多少。 有大佬分析下吗。 回答1:如果经常使用还是开的好,注册域名也便宜。 回答2:经常竞价拿米的可以开一个。不经常拿米就没必要开。 回答3:如果你玩竞价的话推荐开通,毕竟返60%,算法不同总之会优惠很多。 回答4:要看,我们从省钱的角度来算一笔账。jm金牌哪些是可以省钱的呢?:1、注册任意后缀域名省五块钱,2、…

    2023年12月3日
    00
  • 百度蜘蛛抓取http不抓取https怎么回事?

    我网站是https的,并且在站长平台做了https认证。看了一下网站日志,发现大量抓取http的然后301到https,请问是什么原因导致蜘蛛大量抓取http的呢? 回答1:加不加https都没啥区别。 回答2:这很正常吧,你是不是做了301? 回答3:301到HTTPS,然后站长后台认证,然后等就行了。 回答4:强制重定向除了在服务器上配置301重定向之外…

    2023年11月15日
    00
  • 蜘蛛爬取页面没有记录是什么原因造成的?

    网站蜘蛛过来爬取页面了,每次爬取页面也是正常的,怎么没有看到蜘蛛爬取记录痕迹,蜘蛛爬取没有记录是哪里问题,网站各个页面都是正常的,就是蜘蛛爬取没有记录咋回事?有什么工具或者查询看看有没什么问题存在? 回答1:有没有开启日志记录功能,没有勾选的话是不会记录的。 回答2:网站在建站时所选用的域名有过被惩罚或者被百度K过的域名,站长们没有对域名的安全性进行更多的检…

    2023年9月2日
    00

发表回复

登录后才能评论