如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 网站后台要重新做,以前的文章数据应该怎么处理?

    我想请教大家一个问题,网站后台要重新做,以前的文章数据应该怎么处理?不同的后台框架数据不互通,应该怎么处理? 回答1:导出来,在重新导入到新的数据库。 回答2:我们之前网站改版,就把老站文章全部404了。 回答3:把以前的文章生成静态保存起来,文章目录保持不变。要么就是把文章数据导入到新网站,然后做301。 回答4:可以把数据导出来,导入新数据库里面。 回答…

    2023年11月24日
    00
  • 网站一直起不来,应该是降权了,请问目前该往哪里做?

    大家好,各位懂的伙伴们,小弟想请教一些问题,希望获得大家的建议与方向。 这个站从布局+内容发布,大概用了2个月左右时间,现在应该是降权了,因为我并不是很精通。 购买一些了3个高权重友联,权2-3,内容相关的,快一个月,没有明显的效果,反而索引还减了一点。 小弟想请问懂的朋友们告诉我一些原因,及具体工作内容,以及优化的步骤,希望来点实质性的方法哈。 在此感谢大…

    2023年11月11日
    00
  • 百度爱采购未参加竞价怎么产品排名?

    百度爱采购未参加竞价推广,自己上传产品还要审核,爱采购未参加竞价推广好不好排名靠前,让爱采购产品排名靠前,一般是怎么做到的,都是百度旗舰下排名是否容易一些,怎么把爱采购优化最好,爱采购有了排名就会有订单量,排名比较重要的,怎么做起来呢?多谢各位分享经验! 回答1:加油包,实地验厂是主要付费产品。 回答2:A、得分越高,星级越高,信息越多;B、加油包,实地验厂…

    2023年9月7日
    00
  • 蜘蛛爬取页面没有记录是什么原因造成的?

    网站蜘蛛过来爬取页面了,每次爬取页面也是正常的,怎么没有看到蜘蛛爬取记录痕迹,蜘蛛爬取没有记录是哪里问题,网站各个页面都是正常的,就是蜘蛛爬取没有记录咋回事?有什么工具或者查询看看有没什么问题存在? 回答1:有没有开启日志记录功能,没有勾选的话是不会记录的。 回答2:网站在建站时所选用的域名有过被惩罚或者被百度K过的域名,站长们没有对域名的安全性进行更多的检…

    2023年9月2日
    00
  • 新网站要被百度收录需要多少天?

    我想咨询下大家,新网站要被百度收录需要多少天? 回答1:我是上线十天左右才收录的,但是收录之后没有收录内页了,我现在老站都有点波动,大家点链接可以帮我看看。 回答2:内容可以的话,首页当天就能收,内页需要3-7天。 回答3:不好说,就在刚才,我看到有个楼主发的,他的站才上线3天就被收录了。加油优化吧! 回答4:这个要看你的优化能力,同时百度收录时间说不准。 …

    2023年9月17日
    00
  • 百度提示网站存在风险怎么处理掉?

    我在百度搜索网站标题,发现网站标题提示有风险模式,我就特别着急,从显示有风险后网站流量也下降了,我怎么处理把风险取消不要显示?当显示风险是什么原因导致的,怎么有风险呢? 回答1:先自查网站代码,有恶意代码就赶紧删除处理,后面再申请解除风险提示。 回答2:检查一下看是不是有问题,如果没有申诉一下看看。 回答3:是不是被挂码了,如果没有申诉一下看看,看看百度怎么…

    2023年11月21日
    00

发表回复

登录后才能评论