作为一个SEO爱好者,分析网站蜘蛛日志是非常必要的。通过网站日志中的数据记录,站长可以很好地诊断我们的网站是否处于健康状态。例如,该博客作者的网站最近遭到了许多黑链攻击,这给网站权重和流量带来了巨大损失。因此,有必要对网站蜘蛛日志进行分析,通过网站调整正确引导搜索引擎蜘蛛的捕获
什么是网站日志
通过百科全书,我们也可以知道,所谓的网站日志是指以日志结尾的文件,它记录了各种原始信息,例如web服务器接收和处理请求以及运行时错误。在这里,网站管理员应该注意,文件的后缀是log。只需下载并使用工具进行分析
如何获取网站日志
不同服务器和虚拟主机上存储的日志文件的位置存在一些差异,但一般的获取方法相对简单。例如,blogger服务器安装了Pagotapanel,网站日志文件存储在file-wwlogs文件夹中。找到相应网站的日志文件,然后下载
网站日志分析工具
有很多网站日志分析工具,如在线网站日志工具lager(http://www.loghao.com/)此外,博客作者经常使用光年网站日志分析工具。这些工具几乎是一样的。有文件和工具。让我们来探索如何分析这些网站数据
常见的网站蜘蛛是什么
百度蜘蛛:它代表百度搜索引擎蜘蛛。从上图可以看出,尹华峰seo博客的搜索引擎爬虫来自百度,占52%
搜狗蜘蛛:它代表搜狗搜索引擎蜘蛛。虽然访问量很小,但爬行的总量非常大,这让博客作者感到可疑。原因是我们网站的一个专栏遭到了攻击,并为搜狗搜索引擎蜘蛛挂上了大量黑链
谷歌蜘蛛:这意味着谷歌搜索引擎蜘蛛需要更多的关注才能成为谷歌SEO的站长
Alexaspider:一个代表网站全球排名的搜索引擎蜘蛛。该爬虫主要分析网站的流量,统计网站的全球排名。目前,该网站在全球排名610481位
此外,实际上还有其他搜索引擎爬虫,如雅虎蜘蛛、360蜘蛛等。以上只是对该网站搜索引擎蜘蛛的总结分析。由于服务器刚刚更换,爬行器捕获和爬网的数据量相对较小,仅供参考。通过日志工具与搜索引擎蜘蛛积极沟通,我们可以进一步分析网站捕获和状态码分析
网站蜘蛛日志分析和解读
目录爬行:可以分析网站目录爬行的数量,了解搜索引擎蜘蛛的爱好。从上图可以看出,sogouspider主要抓取我的/kjzx/目录。与其他目录相比,抓取的数量相对较大,也有例外。所以我去了网站的根目录查看,发现了带有黑链的脚本文件,这也证实了博主之前的判断
页面爬行:页面爬行量相对稳定。无页面爬行量大且异常。在这里,博主将不再截图,但博主发现爬行量最大的页面是robotsTxt文件,所以站长设置机器人规则也很重要
状态码返回的分析和解释
200代表搜索引擎蜘蛛的成功访问
04代表页面无法访问
01代表页面跳转
304代表客户端已经执行get,但文件没有更改
500状态代码表示服务器遇到错误,无法完成请求
403状态代码表示服务器拒绝请求
以上是本网站遇到的一些蜘蛛状态代码(有关更多状态代码,请参阅网站日志中常见HTTP状态代码的分析)。网站管理员可以通过查看非200值的状态代码并分析这些异常URL路径,轻松找到网站的症结所在
网站日志的作用
网站日志分析应该是SEO网站管理员的必要技能。网站日志分析在新旧网站中都扮演着重要角色。通过日志分析,了解网站蜘蛛抓捕频率、是否被锁在沙箱中、网站是否被k、发现异常抓捕等
结论:通过对网站蜘蛛日志的分析,SEO站长可以很好地自我检查和诊断网站是否存在问题。他不仅可以了解网站的健康状况,还可以通过爬行量进一步了解搜索引擎蜘蛛的爱好,了解网站内容操作的重点,这也可以起到很好的指导作用。