详细解读叫你如何查看分析网站日志以及状态返回码

怎样查看网站日志文件?什么是网站日志?所谓的网站日志,就是网站所在服什么是网站日志?所谓的网站日志,就是网站所在服务器接受用户的各种请求的时候进行的处理状况的记录,无论是正常处理或者是出了各种错误,都

怎样查看网站日志文件?

什么是网站日志?

所谓的网站日志,就是网站所在服什么是网站日志?

所谓的网站日志,就是网站所在服务器接受用户的各种请求的时候进行的处理状况的记录,无论是正常处理或者是出了各种错误,都会在网站日志中记录下来,其文件结尾以.log 为扩展名。

怎样查看网站日志?

220.181.108.180 – - [25/May/2011:20:21:56 0800] “GET / HTTP/1.1″ 200 12447 “-” “Mozilla/5.0 (compatible; Baiduspider/2.0; http://www.baidu.com/search/spider.html)”

下面我来详细的叙述一下这段网站日志都可以告诉我们哪些有用的信息。

220.181.108.180——这是用户的IP 地址,相信大家都能轻易看懂。知道了用户的IP ,你甚至可以通过查询来得知用户是来自哪个国家、哪个省份、哪个城市的。查询得知,这个IP 来自国内北京地区。不同的网站其用户群会有比较明显的区别,比如我的博客肯定大多数访问者是来自沈阳的,而有的网站其用户没有什么明显的地域区别。用户IP 配合下面的关键词等信息可以让你更加有效的分析网站的用户体验做得够不够好。

[25/May/2011:20:21:56 0800]——这里讲的是发生该处理请求的具体时间。这里的时间是2011年5月25日20点21分56秒,后面的 0800则指的是时区,即所在地方相对应英国伦敦格林尼治时间, 0800代表的是东八区的时间。

GET ——这是服务器的处理动作,一共只有两种:GET 和POST 。在网站日志中绝大部分都是GET ,只有在进行CGI 处理的时候才会出现POST ,否则绝大多数时间服务器的响应都是GET ,也就是用户从服务器上获取了页面或者别的文件。注意了,G ET 后面还有一个“/”,这里代表的是用户访问的页面,只有一个斜杠自然代表访问的是网站首页。比如GET/http://www.1zhan4.com/ 和GET/两者表示的含义是一样的。

HTTP/1.1——这个代表用户访问该页面的时候,是通过HTTP1.1协议进行传输的,也就是超文本传输1.1版本协议。这个我们不必理会,因为网站日志中除了你可能用FTP 之外,普通用户基本都是通过HTTP 协议来进行访问的(个别提供FTP 下载的网站除外) 。 200 0 64:

文件被64位系统的访客或者蜘蛛正常访问或抓取.

200 0 0:

文件被32位系统的访客或者蜘蛛正常访问或抓取.

200 12447——代表的是用户访问页面的时候返回的状态码。通常状态码有以下几种:200,301,302,304,404,500等。200代表用户成功的获取到了所请求的文件,如果是搜索引擎,则证明蜘蛛在这次爬行中顺利的发现了一些新的内容。而301则代表用户所访问的某个页面url 已经做了301重定向(永久性) 处理,302则是暂时性重定向,如果你的网站日志中有过多的302代码,那么你需要注意了,是

,

不是把301做错了做成了302? 赶紧修改,搜索引擎不喜欢302重定向。404则代表所访问的页面已经不存在了,或者说访问的url 根本就是个错误的。500则是服务器的错误。状态码是比较多的,想要详细了解的朋友请自己去搜一下吧,网上相关的信息还是非常多的。后面的12447代表的是被访问页面的体积,我的博客由于采用了gzip 压缩,所以首页只有不到12.5KB 。 Mozilla/5.0 (compatible; Baiduspider/2.0; http://www.baidu.com/search/spider.html)——这一行则详细的说明了用户的一些状况。当然,我所选择的这一段网站日志实际上是百度蜘蛛作为用户被网站日志记录了下来。这一整行就代表了用户是百度的蜘蛛,注意一下,从今年的5月10号开始百度蜘蛛的字段发现了变化,变成了这行代码。原来的是Baiduspider ( http://www.baidu.com/search/spider.htm)。实际上从这一部分日志中可以看到用户采用的是什么浏览器,通过哪个搜索引擎的哪个关键词来到了该页面等等。

以上就是简单的对一段网站日志的分析,当然实际上大多数时候我们根本不需要这样人工查看网站日志,有大把的SEO 工具可以供我们使用分析网站日志。不过当你的网站确实出现了一些问题的时候,那么一般的日志分析软件就无法帮助你了,你必须亲自查看日志,这个时候这篇文章说不定就派上用场了,是不?

HTTP 状态码 摘要说明

--------------------------------------------------------------------------------

200 服务器已成功处理了请求并提供了请求的网页。

204 服务器成功处理了请求,但没有返回任何内容。

301 请求的网页已永久移动到新位置。当URLs 发生变化时,使用301代码。搜索引擎索引中保存新的URL 。

302 请求的网页临时移动到新位置。搜索引擎索引中保存原来的URL 。

304 如果网页自请求者上次请求后没有更新,则用304代码告诉搜索引擎机器人,可节省带宽和开销。

400 服务器不理解请求的语法。

403 服务器拒绝请求。

404 服务器找不到请求的网页。服务器上不存在的网页经常会返回此代码。

410 请求的资源永久删除后,服务器返回此响应。该代码与 404(未找到)代码相似,但在资源以前存在而现在不存在的情况下,有时用来替代404 代码。如果资源已永久删除,应当使用 301 指定资源的新位置。

500 服务器遇到错误,无法完成请求。

503 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态

标签: