导读:很多SEOer新手在做优化的时候,经常忽略了网站日志的作用,甚至有很多SEOer老鸟也容易忽视它,网站日志是网站与搜索引擎交流的记录,我们通过网站日志能够了解搜索引擎对我们网站的喜好,并且通过网站日志,我们能够了解平时我们分析不到的东西,今天小浪就来给大家讲讲网站日志到底该如何分析!
有人可能会不屑:网站日志这么简单的东西谁不知道?但并不是每个人生来就会SEO,并不是每个人生来就是高手,而且往往最简单的东西最容易被忽视。我之前就讲过网站日志的作用,这里就不详细介绍了,进入今天的主题:网站日志怎么分析?
网站日志在哪里?
首先我们需要打开网站的空间,也就是我们网站程序所在的地方,通过ftp地址进入,进去之后一般都有个logs文件夹,而我们的网站日志就是在这里面,如图:
如果没有找到这个文件夹,就要联系空间商(服务器商)让他们帮忙处理。
而网站日志文件夹的名字通常是以日期命名的,如图:
网站日志怎么分析?
把上图显示的网站日志文件下载下来之后,打开就会出现如下图所示:
是不是看上去眼花缭乱?不要急,查看这里面的内容其实很简单。我只要查找:baiduspider就够了,如图:
找到有baiduspider的地方就开始分析,如上图里面的这个网址,就表示百度蜘蛛爬行到了我的这个页面/wangluoyingxiaowaibaofangan/126-228.html,而后面的200是一个代码状态,表示百度成功的抓取了我的这个页面,后面的7296就是这个页面的数据,也就是说百度蜘蛛爬行并抓取了我的这个页面,并且抓取的数据大小为7296.
200代码在日志中是最常见的,如果某个页面没有在网站日志里面显示被百度蜘蛛爬行抓取,那么可能是网站结构层次有问题,页面纵向深度太深;如果显示为200代码,但是在百度里面显示该页面没有被收录,那么就是网页没有被“放出来”,需要耐心等待,如果长时间还没有放出来,那么可能就是网页质量不过关,需要改进页面质量。
接下来我们再开看看这一条记录,如图:
看上去它和上一个图没有太大的区别,但是仔细看,就会发现他们的状态码不一样,上一个的状态码是200,而这里的是404,404表示什么意思相信大家都知道,也就是说百度蜘蛛爬行这个页面的时候,没有找到这个页面,所以出现了404的代码,遇到404代码,我们就要注意了,看看是否是网站程序有问题导致网页打不开,如果确实为网页已经被删除,那么就需要向百度提交死链接。
另外还有一些常用状态码的意义:
301:页面重定向,经常用于网站首选域。
304:如果客户端发送了一个带条件的 GET 请求且该请求已被允许,而文档的内容(自上次访问以来或者根据请求的条件)并没有改变,则服务器应当返回这个304状态码.简单的表达就是:客户端已经执行了GET,但文件未变化。
文章评论 本文章有个评论