如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 上线7个月,采集发布12万,收录只有300条,怎么办?

    上线了7个月,每天都更新发布,采集发布了12万条内容,收录才有300多条,怎么办,是不是废了? 回答1:采集的文章内容、标题都不好。 回答2:采集的质量不高,收录就低。我尝试了很多,跟你一样去采集同行的内容,基本都是不收录,或者收录了也不给排名! 回答3:采集的质量不高,肯定不给收录啦,不拉黑你就不错了。 回答4:1、建议持续运营在等等吧,域名信任度低,可能…

    2023年11月3日
    00
  • 如何才能提高资源提交工具的提交配额?

    其实不管是抓取频次还是资源提交配额,其根本还是内容,如果能够持续更新大量优质的内容,这两个问题就都能解决。反之,如果网站更新的内容少,并且还不是优质的,这种情况下,搜索引擎肯定就不会给与好的评价了。 有的朋友总是希望通过投诉或者是反馈来获得加成,这种思维开始就错了!搜索引擎毕竟还是机器的,它会依照既定的规则去调整,而百度搜索也不可能去人工来调整某个网站资源提…

    2023年12月9日
    00
  • 老域名解析ip生效很慢怎么回事?

    是这样的,我昨天上线了一个网站, 用的是一直做站的域名,做了半年了,我用老站的域名重新做站, 解析新的IP,用了新的dns, 现在有时候打不开,我全国测速,差不多还有10%地区没有解析成功, 现在已经24小时了,怎么这么慢,你们遇到过吗? 大概多久可以生效? 回答1:有的域名注册商就是很慢,特别是有些国外的。 回答2:我解析易名阿里云一般都秒生效。 回答3:…

    2023年8月2日
    00
  • 网站被采集会导致自己网站排名下降吗?

    如果你的站点权重很高,被采集也没事;但如果你的站点权重很低,就会受到影响,导致排名下降。 比如说新浪搜狐这样的大门户站点,你去采集它们的文章,对它们来说丝毫不受影响的。所以,如果你的站点权重很高,文章发布以后第一时间被百度抓取了,并且收录也挺快,这样情况下站点受到的影响就很小。 但如果你的站点权重低,尤其是新站。这种情况下,搜索引擎蜘蛛不会及时来抓取新内容,…

    2023年10月11日
    00
  • 做网站你赚到钱了吗?分享我的经历

    兼职做了十年网站,没赚到大钱,一共赚了30万吧,跟大佬们肯定没法比,因为在adsense群里有的大佬一个双十一就能赚这些。我做网站没有巧劲、也没有窍门,纯粹是赚个辛苦钱。 初期两年不懂网站的套路,基本就是做垃圾站用dedecms,胡乱采集一些内容,有点权重和排名了,就去卖链接,每月能卖1000左右。后来把其中一个垂直内容的网站卖了,卖了2000。发现原来网站…

    2023年11月8日
    00
  • 老域名建站为什么百度不收录?(老域名没有被百度收录)

    虽然老域名有些优势(也得具体看情况,看老域名的权重如何,是否处在被惩罚期),但毕竟是搭建新站,所以百度收录慢些也是正常的,遇到这种情况,就把老域名当成全新域名来看待就行,正常优化! 提这个问题的朋友表示,自己花钱买了老域名(域名持续存在,没有过期),但是建站后发现百度并不能快速收录,所以想要知道其中的原因到底是什么。事实上,这个问题没有绝对的答案,比如说如果…

    2023年10月21日
    00

发表回复

登录后才能评论