web的日志分析文档

web的日志分析文档

ID:15407027

大小:44.00 KB

页数:15页

时间:2018-08-03

web的日志分析文档_第1页
web的日志分析文档_第2页
web的日志分析文档_第3页
web的日志分析文档_第4页
web的日志分析文档_第5页
资源描述:

《web的日志分析文档》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、web的日志分析文档一、前言随着Internet上Web服务的发展,几乎各个政府部门、公司、大专院校、科研院所等都在构建或正在建设自己的网站。而与此同时,在构建网站建设中各个单位都会遇到各种各样的问题,那么对web服务器的运行和访问情况进行详细和周全的分析对于了解网站运行情况,发现网站存在的不足,促进网站的更好发展重要性是不言而喻的。管理Web网站不只是监视Web的速度和Web的内容传送,它要求不仅仅关注服务器每天的吞吐量,还要了解对这些Web网站的外来访问,了解网站各页面的访问情况,根据各页面的点击频率来改

2、善网页的内容和质量、提高内容的可读性,跟踪包含有商业交易的步骤以及管理Web网站“幕后”的数据等。为了更好地提供WWW服务,监控WEB服务器的运行情况、了解网站内容的详细访问状况就越来越显得重要和迫切了。而这些要求都可以通过对web服务器的日志文件的统计和分析来做到。二、WEB日志分析的原理网站服务器日志记录了web服务器接收处理请求以及运行时错误等各种原始信息。通过对日志进行统计、分析、综合,就能有效地掌握服务器的运行状况,发现和排除错误原因、了解客户访问分布等,更好的加强系统的维护和管理。在WWW服务模型

3、是非常简单的(见图1):1)客户端(浏览器)和web服务器建立tcp连接,连接建立以后,向web服务器发出访问请求(如:get),根据HTTP协议该请求中包含了客户端的IP地址、浏览器的类型、请求的URL等一系列信息。图1web访问机制2)web服务器收到请求后,将客户端要求的页面内容返回到客户端。如果出现错误,那么返回错误代码。 3)服务器端将访问信息和错误信息纪录到日志文件里。下面是客户端发送给web服务器请求的数据报的内容:GET/engineer/ideal/list.htmHTTP/1.1Accep

4、t:image/gif,image/x-xbitmap,image/jpeg,image/pjpeg,application/vnd.ms-powerpoint,application/vnd.ms-excel,application/msword,*/*Referer:http://www.linuxaid.com.cn/engineer/ideal/Accept-Language:zh-cnAccept-Encoding:gzip,deflateUser-Agent:Mozilla/4.0(compati

5、ble;MSIE6.0;WindowsNT5.0)Host:http://www.linuxaid.com.cn/Connection:Keep-Alive可以看到,在客户机的请求里包含了很多有用的信息,例如:客户端类型等等。而web服务器就会将请求的web页内容发送返回给客户机。目前最常用的web服务器有Apache、Netscapeenterpriseserver、MSIIS等。而目前互联网上最常用的web服务器就是apache,因此我们这里的讨论都以Linux+apache环境讨论,其他的应用环境类似。

6、对于Apache来说,支持多种日志文件格式,最常见的是common和combined两种模式,其中combined方式比common方式的日志的信息要多Referer(该请求来自于哪里,例如来自于yahoo的搜索引擎)和User-agent(用户客户端类型,如mozilla或IE)。我们这里讨论combined类型。下面是common类型的日志示例:218.242.102.121--[06/Dec/2002:00:00:00+0000]"GET/2/face/shnew/ad/via20020915logo.

7、gifHTTP/1.1"3040"http://www.mpsoft.net/""Mozilla/4.0(compatible;MSIE6.0;Windows9"61.139.226.47--[06/Dec/2002:00:00:00+0000]"GET/cgi-bin/guanggaotmp.cgi?1HTTP/1.1"200178"http://www3.beareyes.com.cn/1/index.php""Mozilla/4.0(compatible;MSIE5.0;Windows98;DigExt

8、)"218.75.41.11--[06/Dec/2002:00:00:00+0000]"GET/2/face/shnew/ad/via20020915logo.gifHTTP/1.1"3040"http://www.mpsoft.net/""Mozilla/4.0(compatible;MSIE5.0;Windows98;DigExt)"61.187.207.104--[06/Dec/2002:00

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。