如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 网站收录被清空是怎么回事?

    我有一个网站最近站点异常了,出现了两个问题。1,站点的site数据被清空,只显示多少数据;2,百度反馈信息:“您好, 经内部排查发现网站不符合搜索质量体验规范的情况,需要网站自查整站优化。感谢您对百度的支持和关注!”。没给出明确的信息。不知道有没有碰到这类情况的大咖,知道怎么去解决的。麻烦说下,感谢。 回答1:1、近期多个站长都是这种情况,并非个例;2、百度…

    2023年11月17日
    00
  • 微信公众号如何快速涨粉?

    用工作室的营业执照申请了个微信服务号(就是收费的公众号),想要涨粉,怎么办? 服务号做的是陪练游戏服务,收费的。 自己想到的几个办法,没做过,求教! 1、买粉丝,有风险,可能被判违规,甚至封号 2、花钱买一个公众号,导流到服务号 3、自己再注册一个公众号,发文章,运营,引导至服务号 4、找广告联盟,付费推广,CPA或CPS涨粉 5、找其他公众号合作,让他们在…

    2023年11月30日
    00
  • wordpress和帝国哪个更安全?

    最近想搭建一个网站,但是自己是新手,对安全运维这块是空包,所以,我在纠结到底是用WordPress还是帝国,哪个更加安全呢? 回答1:两个都不错,但是数据大建议用帝国。 回答2:帝国负载好。WP不会优化就很卡很卡很卡。 回答3:小数据,10万以内建议wp,几十万数据建议帝国。 回答4:从技术角度来说,wordpress更安全,毕竟几百万开发者。 回答5:帝国…

    2023年10月13日
    00
  • 服务器正常网站无法访问怎么办?

    服务器正常,网站无法访问,PING也可以ping通,宝塔也能上,就是网站连接超时,宝塔也没有安装防火墙,大佬们知道这是什么情况吗?用手机流量也无法访问。 回答1:还有一种可能就是域名没有加入白名单,运营商限制了。 回答2:端口开放了的话就是程序的问题了。 回答3:数据库按照内存限制下。然后默认页index.php改成404的试试看。 回答4:我想大概率是你设…

    2023年9月11日
    00
  • 网站的关键词一般设置多少个字符?

    关键词具体多少个字,这没有绝对的标准,要根本实际情况来定,对字数也没有很严格的要求,两个字行,十个字也可以!但是在确定关键词的时候,要注意分词和组合,这会衍生出很多关键词。 以十九派为例,首页的关键词可以是“SEO”“SEO培训”“SEO实战培训”等这些短的词。如果网站定位很细分,定位成为广州SEO培训机构,那么关键词就可以设置为“广州SEO培训机构”,甚至…

    2023年11月26日
    00
  • 为什么网站一下子很多同段IP进来?

    为什么网站一下子很多同段IP进来?有没有懂得人解释一下呢?谢谢!IP如下: 27.115.124.4;27.115.124.2;1.192.195.5;1.192.195.5。 回答1:只要不是恶意点击这种,这种无影响。 回答2:ip应该是被刷了,免费的不理就行,付费的话可以屏蔽下。 回答3:1、只要不是恶意点击这种,这种无影响的;2、如果有操作竞价,出现这…

    2023年10月13日
    00

发表回复

登录后才能评论