如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 什么样的外链是好的外链?

    抛开搜索引擎对外链有效性的判断不说,假如这些外链是有效的,那么怎样的外链效果更加?大家应该能够想到相关性这个维度。到底这个相关性是啥意思呢,本文简单给大家说下。 十九派看到很多人在搜外问答发外链,外链内容提到了自己行业。比如说旅游站点,这些朋友就发类似“网速会影响到旅游站点的优化吗”这样的帖子。咋一看,这帖子还真提到了旅游这个关键词,但大家觉得这外链有相关性…

    2023年10月7日
    00
  • 新站如何开始优化?网站优化seo怎么做?

    其实SEO最难熬的还是前期没起来之前的那段时期,在那段时间里,可能会无论怎么更新,收录很慢,或者不收录,无论怎么做外链,做友链,排名还是一点都没有,这个时间段可能是三个月,半年,甚至是一年。 但是真正挺过这个时期,开始出词,起权重之后,想要涨权重还是很快的,只要坚持去针对性的做权重词,那么涨权重是很容易的事情。因为我的是手更站,所以本身数据有限,每日更新的数…

    2023年8月15日
    00
  • 网站大批量的链接出现更改,会有哪些影响?

    主要是路径发生了变化,对网站会有哪些不利影响,影响是否会很大? 回答1:A、有规律可循可301集权;B、无规律可循,只能是已收录的死链接整理提交删除,新的URL提交推送;C、如果这些页面都是有效收录,有词排名,那么URL变更,出现死链接,收录和词库排名都会有所波动,影响比较大,如果词库量不多,那么对流量影响不大。ps:是否修改看站长规划,如果之前的很稳定,收…

    2023年8月28日
    00
  • 新网站多长时间有排名?一个月可以吗?

    最近做了个新站,首页已经收录了,但是还没有关键词排名。想问下新站的话优化一个月的时间能不能有关键词排名呢? 正常情况下,一个月的新站基本没有关键词排名。在新站上线之初由于百度照顾新站,可能会出现部分关键词有排名,但这些排名往往是不长久的,过不了多久排名就是消失。 如果新站只有一个月时间的话,由于各项数据都没有起来,百度搜索也不会给出好的展现的。根据笔者的经验…

    2023年8月8日
    00
  • ibtmp1文件过大怎么办?(ibtmp1文件居然达到了30G)

    我想请教大家一个问题,宝塔面板 www/server/data ibtmp1文件过大,此文件是MySQL的临时表,临时表空间,居然达到了30G,有没有懂得大佬给我解答下怎么在宝塔限制该文件的大小。 有人说修改这个配置可以限制但是我看好像没有效果,半个小时后又是30多G了。 回答1:好像可以改mysql配置,不要这些文件。 回答2:修改my.cnf配置文件,为…

    2023年11月20日
    00
  • 为什么网站一直没有索引量呢?网站没索引怎么解决?

    索引量是百度纳入索引库的数据,目前来看这个索引量数据的展示存在延迟的现象,大家可以具体看看显示的日期。这里的日期最新的应该昨天,如果显示的时间是昨天,而索引量没有数据,那就只能说明网站页面还没有百度纳入索引库。 另外除了日期上的延迟,索引本身也存在延迟。我们有时候会发现,用site命令查询能看到网站被收录的页面,但是在索引里看到的数据确实0。如果你的网站一直…

    2023年8月23日
    00

发表回复

登录后才能评论