如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 服务器配置如何挑选好的?

    在相同的价格,相同的服务器供应商,相同带宽,相同环境下,先说我的结论,我两个都用了,很明显4h8g轻量云要比2h4g标准云好太多了。都是2800一年,但是4h8g轻量云运行流程,网站速度快很多。但我当时买的时候,大部分人推荐买2h4g标准云,其实我是不能理解的。 回答1:2h4g的标准云整体性能不是轻量可比的,虽然我用着不少轻量,但是还是推荐标准云,现在也在…

    2023年8月1日
    00
  • 网站打开突然变成反诈中心了怎么办?

    网站打开突然变成反诈中心了,打电话反诈中心的人员说没有拦截,有遇到这种情况的朋友吗?麻烦给支支招。 回答1:估计是哪个关键词,或者你网站带支付系统。 回答2:有没有可能是本人做跳转了,而你没有发现。 回答3:检查关键字和友链,有问题的马上删除。 回答4:检测一下,肯定只是某个地区拦截!!! 回答5:估计是被举报了,运营商给屏蔽了。 回答6:反诈这东西不明白,…

    2023年10月27日
    00
  • 哪个cms的模板最好做一些?

    最好做模板的cms是什么? 做模板标签比较简单,不需要学那么多语法的。 回答1:只用过wp和帝国cms,没用过其他程序开发过模版,个人觉得帝国cms很容易就是简单在html标签外围套上灵动标签就行,灵动标签后台可以生成,涉及到sql调用,如果会sql更容易,如果不会,对应使用手册中案例写,非常简单,给我一套html页面,不涉及过多php二开内容,我基本2小时…

    2023年7月25日
    00
  • 新站如何避免被搜索引擎惩罚?

    如题:新站如何避免被搜索引擎惩罚? 回答1:不过度优化,采集,违规就行。 回答2:正常优化,不要过度采集,关键词密度要控制好,就没啥大问题。 回答3:新站好好做内容,不用黑帽优化手法,被打击的几率是很小的。 回答4:坚持原创内容,不采集,不用任何作弊手段,最重要的是,运气要好。 回答5:每天稳定更新,一定要做高质量的原创文章,不要采集,要多做外链建设,这样就…

    2023年11月24日
    00
  • 高权重友链可以提升网站权重吗?

    真正优质的友情链接是可以提升网站权重的,因为在搜索引擎的计算里面,友情链接类似投票,它不仅能够帮助搜索引擎去判断网站的主题,同时还提供权威性和投票支持,所以是可以有些提升权重的。但这样有个问题,那就是要搞清楚什么样的友链才是高权重、高质量的友链! 高权重、优质友链有两个要求,首先的是友链所在网站跟我们的网站是相关的,其次是友链所在网站的权重很高! 举个简单的…

    2023年10月25日
    00
  • 360不收录怎么办?

    现在遇到了个棘手问题,想请教大家帮忙看看,看有没有什么建议或者不一样的见解,网站百度能正常收录,但是360只收录首页,都很长时间了360始终不收取其他页面,360站长平台站点地图已经定时提交,软文文章也在经常更新,360搜索始终不收录其他界面,懂的朋友帮忙看看,如果是像以下这些答复就不用回答了,因为大家都知道而且也都在运用,希望有点干货谢谢。 1、站生成Si…

    2023年9月29日
    00

发表回复

登录后才能评论