如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 新站审核期大概有多久啊?

    网站上线13天了,首页收录才4天,看蜘蛛一直抓的是首页,不抓内页,应该是进入沙盒期了吧?想问问大家这个时间大概有多久啊?好难等。 回答1:正常来说1-3个月。 回答2:1到3个月,不要着急,慢慢来。 回答3:新站有1-3个月的考察期。 回答4:新站有考察期1-3个月,无违规可快速通过。 回答5:才13天就不要那么着急了。3个月内都是考察期! 回答6:1、新站…

    2023年10月31日
    00
  • 网站蜘蛛不抓取怎么解决?(网站新文章蜘蛛不抓取了)

    网站新文章蜘蛛不抓取了,20天了,有啥好办法吗?旧内容蜘蛛抓取稳定。反馈给百度,百度还是统一的那种回复:不符合质量规范。 那么,网站蜘蛛不抓取怎么解决? 回答1:旧文章页面放点新文章链接,看看能不能引蜘蛛过去爬。 回答2:质量不行,那就试试聚合,试试伪原创润色或者生成。再排查有没有被黑,有没有镜像,如果有能力把之前的内容清洗更新一下。试试看。 回答3:更新一…

    2023年8月16日
    00
  • 为什么关键词排名不稳定?(百度关键词排名突然消失了)

    关键词排名波动是正常的,这也说明了搜索引擎综合处理的速度快了。关键词排名涉及到很多方面的因素,比如说网站本身的问题、比如说竞争对手的问题、比如说用户需求的问题等等。搜索引擎会根据这些综合因素,调整关键词的排名顺序。 1、网站本身的问题影响排名的波动 比如说网站服务器不稳定,比如说在某段时间里面用户体验不好,导致用户的行为数据不好等等。 2、竞争对手的问题影响…

    2023年8月7日
    00
  • 挖掘关键词的方法和技巧有哪些?

    网站建设好已经上线三天有了,现在还没有确定住关键词,怎么挖掘关键词,挖掘关键词的技巧方法都有哪些,怎么挖掘好的关键词呢?网站确定一个关键词需要掌握哪些技巧,有哪些可以挖掘关键词的操作与好用的工具?麻烦各位推荐一款,好用的工具呢? 回答1:挖掘关键词的工具很多,你可以用百度的相关搜索,百度的相关推荐,5118,爱站工具这些,都是可以的。 回答2:挖掘关键词很重…

    2023年9月26日
    00
  • 服务配置不够用,是直接升级好还是开一个更高配置的?

    各位大哥,问下,我有一个有点流量的网站,腾讯云轻量香港的服务器,内存比较小,占用百分之80多了,服务器套了CDN的,我现在想升级,不知道是直接升级好,还是开一个新的服务器把原来的数据转移过去好(配置比老服务器好),选那一个方案不影响网站呢?或是影响最小。 直接升级是不是还是原来的IP?感觉腾讯云升级好像是把原有的数据直接转到新服务器上一样,然后IP好像不变,…

    2023年9月5日
    00
  • 复制公众号里面的文章算不算原创文章?

    要具体分析,如果公众号里面的文章没有在百度出现,那复制过来就算原创文章,否则则不算。 目前为此,百度搜索似乎并不会去抓取微信公众号里面的文章。所以如果某篇公众号文章本身是原创的,并且没有被其他网站转载使用,那么复制这样的文章对于百度搜索来说就算是原创文章。 但是要注意,搜狗搜索是会收录微信公众号文章的,并且还单独有个频道。所以,对于搜狗搜索来说,辅助公众号文…

    2023年7月25日
    00

发表回复

登录后才能评论