如何查看网站被百度抓取的情况?

百度用于抓取网页的程序叫做Baiduspider – 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。

如何查看网站被百度抓取的情况?

查看日志的方式:

通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。

因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。

如何查看网站被百度抓取的情况?

日志内容如下:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
分析:

GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。

200 代表成功抓取。

8450 代表抓取了8450个字节。

如果你的日志里格式不是如此,则代表日志格式设置不同。

很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。

抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。

在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

提供域名被墙检测、DNS污染查询和域名301跳转。发布者:admin,转转请注明出处:https://www.jiupaicom.com/wangzhanyunying/5924.html

(0)
上一篇 2023年10月27日 上午9:26
下一篇 2023年10月27日 上午9:28

相关推荐

  • 新网站上线几天后更换新域名,搜索结果百度一直展示老域名

    这个月初上线了新网站,最初用的是a.com这个域名,上线后发现这个域名有黑历史,在搜外网友的建议下我们更换了新域名b.com,目前网站在日常更新。然后现在过去半个月了,百度搜索我们公司品牌词“七猫网络”还是展示的a.com这个域名结果,新网站通过品牌词“七猫网络”一直搜索不到,很急。投诉快照也没有找到入口,我就通过用户反馈提交过后也没有回应。 回答1:既然有…

    2023年11月19日
    00
  • 网站site一年都没有数据,但是site全部又有最近的文章是为什么?

    我想请教大家一个问题,我有一个文章网站,做了一年多了,网站site一年都没有数据,但是site全部又有最近的文章是为什么? 回答1:不要在乎这些细节,总Site还不稳定呢!何况月周日,更新速度不一样! 回答2:1、Site数据也是仅供参考;2、有新的页面更新,site不显示这种也正常,索引数据有无变化;ps:site域名是参考。 回答3:Site不准确,仅供…

    2023年11月20日
    00
  • 文章不加图片更容易获得排名吗?

    不是!SEO文章是否能获得排名跟是否加了图片没有绝对关系,决定文章排名的核心因素还是内容! 比如交换友链是什么意思,互换友情链接好处是什么这篇文章,里面就没有添加图片,但在百度搜索“友链互换”这个关键词的时候,也有不错的排名。 其实SEO文章要不要加图片,主要还是考虑是否需要加!像解释交换友链是什么意思这样的文章,根本不需要图片来辅助说明!所以,这个文章即使…

    2023年10月9日
    00
  • 有什么办法阻止网站被疯狂扫描采集?

    我想问一下各位大神,有什么办法阻止网站被疯狂扫描采集? 回答1:屏蔽国外IP。或者设置短时间内,某个IP大量链接就封IP。 回答2:把蛛蛛爬虫屏蔽掉。加上水印,加上一些乱码。 回答3:屏蔽所有海外ip,短时间的ip访问,自动封。 回答4:屏蔽IP吧,不然就关站。 回答5:在宝塔面板设置屏蔽IP,你先看看IP段是哪些?如果是国外的,就直接禁止国外访问就行了。如…

    2023年10月30日
    00
  • 关键词密度在10%算正常吗?

    关键词密度不是绝对的,有些情况下可能会超过10%,有些时候可能只有1%不到,这些都是正常的,主要是看关键词的出现是否和自然合理的,如果自然合理,即便超出10%也没事。 在计算关键词密度时,还需要考虑到关键词的长度。比如说本文,如果把关键词定义为“关键词”,那么它的密度肯定会比较大;但如果定义为“关键词密度”,那相对就会小些。 虽然通常的建议是关键词的密度在2…

    2023年12月9日
    00
  • 怎么删除百度收录的链接?

    怎么删除百度收录?文章还在,只删收录。大家有办法吗? 回答1:试试搜索结果下面的反馈,反馈一下试试了。 回答2:服务器设置一下,百度蜘蛛抓取返回404。然后死链提交一下。 回答3:给百度蜘蛛返回404,然后提交死链。 回答4:写robots,顺便删除掉这个页面,同样的内容在发一个。 回答5:禁止百度收录,去百度后台提交删除收录。 回答6:A.如果对方没有内容…

    2023年9月25日
    00

发表回复

登录后才能评论