如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 百度没收录的文章怎么处理?

    因为以前有过采集,网站有部分文章未被百度收录,未收录的文章是删除觉得可惜,编辑后能不能继续使用,有哪些方法可以继续用,百度未收录的文章还有机会被收录吗?怎么处理未收录的文章呢?我应该怎么处理,麻烦大家指导下谢谢。 回答1:如果不想删除,可以整理编辑重新提交。 回答2:重新编辑一下修改一下标题,提交试试。 回答3:没收录不很正常吗,每篇都收录哪有那么好的事情。…

    2023年10月28日
    00
  • 新站每天保持多少篇文章更新比较好一些?

    网站已经建设好完毕,每天保持更新文章内容,一天保持多少篇文章内容合适,怎么合理的优化好,有哪些可以优化的,平均一天多篇文章最好?文章多少字数呢?我的都没有按时更新,最近开始运营的,能不能优化也属于新站了。 回答1:保证质量越多越好啊。 回答2:我的网站是保持每天5-8篇,新站持续3个月了,感觉没啥效果。 回答3:保持稳定的更新比单次数量多要好。 回答4:提高…

    2023年9月16日
    00
  • 百度爱采购未参加竞价怎么产品排名?

    百度爱采购未参加竞价推广,自己上传产品还要审核,爱采购未参加竞价推广好不好排名靠前,让爱采购产品排名靠前,一般是怎么做到的,都是百度旗舰下排名是否容易一些,怎么把爱采购优化最好,爱采购有了排名就会有订单量,排名比较重要的,怎么做起来呢?多谢各位分享经验! 回答1:加油包,实地验厂是主要付费产品。 回答2:A、得分越高,星级越高,信息越多;B、加油包,实地验厂…

    2023年9月7日
    00
  • 已经备案的网站一直不收录怎么办?

    我有一个网站,已经备案了,每天也是稳定更新,但是不更新,是怎么回事? 回答1:现在收录都比较慢,可以试试搜外的蜘蛛池和收录宝,还不错。 回答2:整站不收录,就建议去反馈下,正常反馈了,也就会先放首页出来,内页后期引蜘蛛也会有。 回答3:前期主要是引蜘蛛抓取,抓取的次数多了,收录率也就上去了,如果光有抓取不收录,那基本就是内容质量不够高。 回答4:现在收录很慢…

    2023年11月23日
    00
  • WordPress内容多了真的会很慢吗?wordpress多少篇文章开始卡?

    我想请教大佬们一个问题,Wordpress内容多了真的会很慢吗? 我之前一直用织梦的,后来人家收费了,所以才用了WordPress,但是我的数据很多,估计有20万数据吧,最担心的就是会卡顿,所以我想问问大家,wordpress多少篇文章开始卡? 回答1:目前两万多数据,8h8g,感觉比其他系统慢太多了,而且也生成静态了,更气人的是生成静态占用十几个G(一篇文…

    2023年8月13日
    00
  • 复制公众号里面的文章算不算原创文章?

    要具体分析,如果公众号里面的文章没有在百度出现,那复制过来就算原创文章,否则则不算。 目前为此,百度搜索似乎并不会去抓取微信公众号里面的文章。所以如果某篇公众号文章本身是原创的,并且没有被其他网站转载使用,那么复制这样的文章对于百度搜索来说就算是原创文章。 但是要注意,搜狗搜索是会收录微信公众号文章的,并且还单独有个频道。所以,对于搜狗搜索来说,辅助公众号文…

    2023年7月25日
    00

发表回复

登录后才能评论