如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 有收录无索引是什么原因?

    我有一个网站是有收录了,差不多500多,但是没有索引量,我在百度站长后台查了,也没有索引量,是怎么回事?什么原因? 回答1:没有关键词排名展现吧,也就是没有流量的页面。 回答2:收录—索引—排名 先收录在索引,一般的情况下,可能是因为时间问题,还没有被百度放入索引库,还有就是收录只是爬取到有这个页面,进行收录,但是页面质量差,非原创等等原因,导致该篇文章无法…

    2023年11月5日
    00
  • WordPress内容多了真的会很慢吗?wordpress多少篇文章开始卡?

    我想请教大佬们一个问题,Wordpress内容多了真的会很慢吗? 我之前一直用织梦的,后来人家收费了,所以才用了WordPress,但是我的数据很多,估计有20万数据吧,最担心的就是会卡顿,所以我想问问大家,wordpress多少篇文章开始卡? 回答1:目前两万多数据,8h8g,感觉比其他系统慢太多了,而且也生成静态了,更气人的是生成静态占用十几个G(一篇文…

    2023年8月13日
    00
  • 已经备案的网站一直不收录怎么办?

    我有一个网站,已经备案了,每天也是稳定更新,但是不更新,是怎么回事? 回答1:现在收录都比较慢,可以试试搜外的蜘蛛池和收录宝,还不错。 回答2:整站不收录,就建议去反馈下,正常反馈了,也就会先放首页出来,内页后期引蜘蛛也会有。 回答3:前期主要是引蜘蛛抓取,抓取的次数多了,收录率也就上去了,如果光有抓取不收录,那基本就是内容质量不够高。 回答4:现在收录很慢…

    2023年11月23日
    00
  • WordPress帖子怎么发布镶嵌式的列表内容?

    各位大佬,请教你们一个问题。我做的是课程网站,有的课程比较多,一节课几十个章节,如果全部发出来,就很长,我找了一个同行的站点,他用的是镶嵌的,可以下拉,这个是怎么做到的? 回答1:两个for循环的事,你做个css就可以,或者找一个插件吧。 回答2:这个不太清楚啊,你应该找个开发问问能不能实现。 回答3:看样子应该是页面,也就是page.php,你新建一个文件…

    2023年11月18日
    00
  • 如何优化网站上的alt标签内容?

    听说标签的优化对于网站来说很重要,那么具体来说,alt标签应该怎么优化呢? 回答:alt标签的优化主要是针对图片而言的,具体如何优化网站上的alt标签,笔者认为要注意以下两个方面。 1、尽量给所有的图片都加上alt标题,其目的是为了告诉搜索引擎图片是什么内容,同时在用户体验上也有好处。 2、在设置alt标签文本内容的时候,需要注意添加的文本必须是跟图片相关的…

    2023年11月12日
    00
  • 纯采集的内容可以有排名吗?

    随着百度搜索引擎算法的更新,现在只要提到内容采集,大家都会本能的认为不行!事实上纯采集的内容更多的不会获得关键词排名,但是如果网站的整站权重比较高,那么即便是纯采集的内容,也会获得排名。 很多seo人员在做网站内容建设的时候都会出现瓶颈,主要是不知道去哪里找内容素材,笔者曾经给大家说过扩展文章素材的方法,有兴趣的朋友可以去看看。 再说回到采集的问题,对于中小…

    2023年11月6日
    00

发表回复

登录后才能评论