如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 搜索引擎怎么判断文章内容的价值?

    更新SEO文章是我们经常要做的,但很多朋友只是机械的在做,不知道这么做到底有什么作用!关于网站文章更新的意义这里不再啰嗦,本文十九派说下很多朋友关心的另外一个问题,搜索怎么判断文章内容的价值? 一、相关性 十九派经常说内容的相关性,这很重要! 比如说有篇专家写的关于蚊虫叮咬的优质文章,这篇文章的确是极度优质,但对于搜索怎么做水煮鱼的用户来说,这文章就没有意义…

    2023年11月26日
    00
  • 腾讯云轻量型2-4配置太拉跨了吗?

    就放了一个网站,整个数据才不到100m,怎么做到mysqld服务占用内存太大,导致内存溢出,从而连接不上数据库呢? 我在想是不是这腾讯云服务器太拉跨了?以前没有这情况的。 回答1:建议设置下占用,应该是跑满导致的。 回答2:轻量云装mysql容易卡。 回答3:是wp拉胯!所以我们现在用帝国的比较多。 回答4:应该是你没设置好优化好,我2C4G5M的腾讯云轻量…

    2023年10月27日
    00
  • 新站百度多久才会收录放出来?

    一个新站多久会全部放出收录量,新站一般是怎么提交的向百度搜索引擎提交,提交后才能被认可了,我们怎么把一个新站提交好,有哪些可以提交的,如何提交最好呢?新站具体是怎么提交的,提交链接让百度早点认可有收录量,我们怎么做比较好? 回答1:上线后3-7天左右,具体看技术。 回答2:快的话半个月,慢的话两三个月都属于正常的,一般半个月一个月都属于正常情况。 回答3:差…

    2023年10月8日
    00
  • zblog置顶的文章如何自定义排序?

    大神们好,zblog置顶的文章怎么才能排序?有插件吗?就是比如我现在发布一篇新文章想置顶到第一位怎么改呢?更改时间也不行,ID也无法更改。应该怎么设置呢? 回答1:后台应该有设置的吧。 回答2:应该是后置顶的排最前面。 回答3:在Z-Blog中,可以通过设置“置顶”属性来实现置顶文章功能。要排序置顶的文章,可以在文章管理页面中进行操作。以下是详细步骤: 1、…

    2023年9月6日
    00
  • 域名备案过期,重新备案网站停20天,对排名和收录有多大影响?

    网站备案不小心过期了,马上要访问不了了,重新备案要20-30天,咨询了阿里云,说交5000块可以加急快速不停网站直接转过去。想问下大神。这种情况是让网站停还是交5000块。 担心的问题: 1.如果已有收录和排名,排名还不错的情况下,停30天会不会收录都没有了,新上线要重新收录。 2.如果重新收录的话,是不是还和新站一样,考核期特别的慢。 3.排名会掉的多厉害…

    2023年12月3日
    00
  • 关键词密度控制在什么范围?

    关键词密度太高后,有哪些可以把关键词密度降低的方法,当关键词密度已经超出范围之内,要如何保持优化更新,怎么关键词密度会很高呢,当关键词密度太高是如何解决的,怎么控制正常范围之内? 回答1:关键词密度太高,就多发文章,稀释关键词密度呀,千万不要堆砌关键词! 回答2:减少不必要的关键词。 回答3:不要超过8%就行,超过了就不太好。 回答4:有关键词密度检测工具,…

    2023年8月27日
    00

发表回复

登录后才能评论