如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 怎么删除百度收录的死链接?

    想要让百度删除已经收录的死链,首先得通过站长平台提交死链,这样百度搜索就会自动去处理;如果很长时间还没有处理,可以去站长平台进行投诉,做完这两件事剩下的基本就是等待了。 百度删除死链的速度没有那么快,大家可以耐心等待下。如果死链的数量不大,其实也没有啥影响的,不提交死链、不投诉也没事。但如果思路的数量比较多,比如说沐风博客昨天删除了800+的页面,这相对于整…

    2023年7月25日
    00
  • 网站降权很长时间了无法恢复怎么办?

    相信不少站长深有体会,近年很多网站降权出现了一个明显的问题:即‘网站降权’恢复变的越来越慢了,甚至‘半年、一年’都无法恢复原有排名。这个问题是怎么造成的呢,又要如何解决呢? 问题一 网站被算法命中,是最常见的降权,这个类型的降权有一个特点:降权后,网站如果可以快速的反应过来,那么恢复速度是比较快的,一般情况下,一个多月就能开始恢复了。毕竟算法的目的,是让网站…

    2023年7月25日
    00
  • 有什么办法阻止网站被疯狂扫描采集?

    我想问一下各位大神,有什么办法阻止网站被疯狂扫描采集? 回答1:屏蔽国外IP。或者设置短时间内,某个IP大量链接就封IP。 回答2:把蛛蛛爬虫屏蔽掉。加上水印,加上一些乱码。 回答3:屏蔽所有海外ip,短时间的ip访问,自动封。 回答4:屏蔽IP吧,不然就关站。 回答5:在宝塔面板设置屏蔽IP,你先看看IP段是哪些?如果是国外的,就直接禁止国外访问就行了。如…

    2023年10月30日
    00
  • 文章怎么才能被百度收录?怎么快速收录呢?

    网站的文章收录比较慢,有没有方法让文章快速被收录呢? 回答:想要搞清楚怎么样让文章快速被收录,首先要明白文章收录的规律。通常来说,百度等搜索引擎更喜欢收录那些价值高的稀有资源,所以我们想要加快文章收录的话,建设高质量的原创文章是最根本的办法。当然,我们在编辑文章的时候需要注意SEO文章规范,毕竟搜索引擎是机器,它是按照某些设定好的规则来抓取和收录页面的。另外…

    2023年11月12日
    00
  • 域名备案过期,重新备案网站停20天,对排名和收录有多大影响?

    网站备案不小心过期了,马上要访问不了了,重新备案要20-30天,咨询了阿里云,说交5000块可以加急快速不停网站直接转过去。想问下大神。这种情况是让网站停还是交5000块。 担心的问题: 1.如果已有收录和排名,排名还不错的情况下,停30天会不会收录都没有了,新上线要重新收录。 2.如果重新收录的话,是不是还和新站一样,考核期特别的慢。 3.排名会掉的多厉害…

    2023年12月3日
    00
  • 网站降权怎么恢复?(分享下我的网站降权恢复经验)

    月初的时候发现网站关键词排名和流量突然大幅度下降,一看就是降权的趋势,吓得我在论坛里发了好几篇帖子询问各路大佬。目前网站数据已经恢复。 下面说下我采取的恢复方法,供大家参考。 首先是找到网站降权的原因,重点分析网站日志,资源平台。像我的网站,查看资源平台发现服务器存在大量抓取错误,分析前几天的网站日志,当天网站几乎全是502。 根据时间推断是服务器问题导致的…

    2023年8月1日
    00

发表回复

登录后才能评论