如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 百度大规模删网站后对我们会有哪些影响?

    这几天百度大规模删网站权限,首先是我们的站长权限不能验证了,那么,请问百度删掉站长的验证权限以后,这些网站的收录是否会被删除呢?比如网站A现在是收录10万条,在本次百度站长权限删除恶劣网站的行列中,那么,过几天后,网站A的收录量是否会被清空呢?欢迎讨论和分享。 回答1:现在10万推送额度,快收权限API推送,都没了,不能添加的话怎么有收录? 回答2:这样也是…

    2023年9月6日
    00
  • 个体户工作室注册哪个领域?

    注册个体户工作室,申请了好多次都不通过,信息类的不允许个体户,网路文化也不允许,我都不知道有啥是允许的了。 回答1:一般项目:日用百货销售;家用电器销售;家具零配件销售;针纺织品销售;鞋帽零售;服装服饰零售;化妆品零售;个人卫生用品销售;日用品销售;母婴用品销售;礼品花卉销售;厨具卫具及日用杂品零售;钟表销售;箱包销售;文具用品零售;户外用品销售;珠宝首饰零…

    2023年9月29日
    00
  • 腾讯云轻量型2-4配置太拉跨了吗?

    就放了一个网站,整个数据才不到100m,怎么做到mysqld服务占用内存太大,导致内存溢出,从而连接不上数据库呢? 我在想是不是这腾讯云服务器太拉跨了?以前没有这情况的。 回答1:建议设置下占用,应该是跑满导致的。 回答2:轻量云装mysql容易卡。 回答3:是wp拉胯!所以我们现在用帝国的比较多。 回答4:应该是你没设置好优化好,我2C4G5M的腾讯云轻量…

    2023年10月27日
    00
  • 新站3个月不收录怎么办?

    三个月前,我上线了一个网站,主要是做美文内容的,每天都在更新原创的文章,现在已经快三个月了,但是还没有收录,有朋友知道是怎么回事吗?怎么办? 回答1:1、备案后,质量稍微差不多,一般很快收录的;2、可以快收的。 回答2:1、域名有备案,建议去百度站长哪里申诉反馈下,正常没问题,首页会提前收录,反馈后,7-30天内首页会收录;2、抓取诊断没问题,没封禁,无违规…

    2023年10月26日
    00
  • 百度收录如何日收?网站如何被百度快速收录?

    如果你想要实现日收,不考虑其他因素,如果就更新数量来讲,一天更新30-50篇才可能持续日收,低于这个数量日收概率也会降低。 回答1:除了更新数量,更新的内容也很关键。 回答2:我这边测试的是一天低于20篇,日收结束,高于20篇持续有日收。 回答3:实际上就是让蜘蛛养成一天多次爬站抓取不同新内容的规律? 回答4:我这边测下来文章原创伪原创没问题的话,越多越好。…

    2023年7月25日
    00
  • 百度提示网站存在风险怎么处理掉?

    我在百度搜索网站标题,发现网站标题提示有风险模式,我就特别着急,从显示有风险后网站流量也下降了,我怎么处理把风险取消不要显示?当显示风险是什么原因导致的,怎么有风险呢? 回答1:先自查网站代码,有恶意代码就赶紧删除处理,后面再申请解除风险提示。 回答2:检查一下看是不是有问题,如果没有申诉一下看看。 回答3:是不是被挂码了,如果没有申诉一下看看,看看百度怎么…

    2023年11月21日
    00

发表回复

登录后才能评论