如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 网站之前被判为低质站点了,怎样能快速恢复?

    网站之前被判为低质站点了,一直在做优化,还没恢复,怎样能快速恢复? 回答1:用站长工具吧,文章用AI检测一下高于60的全部删掉,然后保存原创一个月,在提交反馈,基本就恢复了! 回答2:这种快不了,只能慢慢优化。 回答3:反馈一下,内容保持高质量输出。 回答4:低质站点唯一特征:有收录,没排名,搜索全标题搜不到,整改措施,请根据《百度网页质量白皮书》进行自查修…

    2023年11月27日
    00
  • 新网站要被百度收录需要多少天?

    我想咨询下大家,新网站要被百度收录需要多少天? 回答1:我是上线十天左右才收录的,但是收录之后没有收录内页了,我现在老站都有点波动,大家点链接可以帮我看看。 回答2:内容可以的话,首页当天就能收,内页需要3-7天。 回答3:不好说,就在刚才,我看到有个楼主发的,他的站才上线3天就被收录了。加油优化吧! 回答4:这个要看你的优化能力,同时百度收录时间说不准。 …

    2023年9月17日
    00
  • 网站怎么选择核心关键词?(网站选择核心关键词的方法)

    我们在优化站点的时候,首先要做的就是确定站点的核心关键词,那么怎样选择网站的核心关键词呢?这个问题相信很多朋友都搞不清楚,包括做SEO有段时间的老手。 通常选择网站核心关键词的方式 通常情况下,大家在选择网站核心关键词的时候,会去考虑行业词。比如说做旅游攻略的站点,会把站点的核心关键词定位“旅游”“旅游攻略”这样的;比如做服装定制的站点,会把核心关键词定为“…

    2023年10月9日
    00
  • 网站日志里面出现了很多网站没有的链接地址?

    网站日志里面出现了很多网站没有的链接地址,很多以xml地址为主而且出现404页面是怎么回事? 回答1:1、网站日志里面出现不存在的链接xml,不存在返回码是404,这种就是本身正常的情况;2、你的站点也并没有被黑,如果被黑了,Site域名就能看到,从日志里可能是有人刷网站而已,返回码404,对方也并没有刷出什么有价值的东西,网站登录地址不要用默认的即可,不用…

    2023年10月29日
    00
  • 一个站长可以管理几个站负责?

    一个人一个站长可以管理几个站,负责几个站的内容等,一个人没有资源可以负责多站吗?正常的情况下站长们负责几个站的优化工作,要是全部依靠原创,不是采集和伪原创哦,那样负责能力有多少站可以负责到位? 回答1:如果全部做原创做多个站就有点吃力了。 回答2:看你的精力能管多少站,不过一定要做优质的网站。 回答3:只要你有足够的精力,多少个站都可以。 回答4:不断可以添…

    2023年11月2日
    00
  • 网站被人恶意刷流量了导致降权怎么办?

    网站前两天突然流量暴涨很多,我昨天查询发现降权了,是不是被人恶意刷流量导致的降权呢?网站降权后还能不能恢复呢,怎么恢复已经降权的站,有哪些可以恢复正常的,网站真的被降权处理了呢?这样的网站还能不能恢复从前? 回答1:1、恶意刷流量,是否影响到你的网站正常访问,导致打不开,如果打不开,蜘蛛抓取异常,那么会影响你的站点,导致降权;2、如果刷的量并未影响网站稳定性…

    2023年11月9日
    00

发表回复

登录后才能评论