基于hadoop的网络日志分析系统研究

基于hadoop的网络日志分析系统研究

ID:33018199

大小:64.35 KB

页数:10页

时间:2019-02-19

基于hadoop的网络日志分析系统研究_第1页
基于hadoop的网络日志分析系统研究_第2页
基于hadoop的网络日志分析系统研究_第3页
基于hadoop的网络日志分析系统研究_第4页
基于hadoop的网络日志分析系统研究_第5页
资源描述:

《基于hadoop的网络日志分析系统研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于Hadoop的网络日志分析系统研究ISSN1009—3044Compu-rKnowle内eandTechnology电脑知识与技术Vol.6,No.22.August2010,PP.6163—6164,6185E一mail:init)@CCCC.net.cnhttp://www.dnzs.net.cnTel汁86—551—56909635690964基于Hadoop的网络口志分析系统研究胡光民•周亮2•柯立新(1」海海洋犬学现代信息与教育技术中心E海201306;2_上海海洋大学信息学院,上海20

2、1306)摘耍:查看网络H志是调查系统故障,监控系统运行状况的重要手段•管理员可以查看在某段时间内所发生的事件•也可以通过对各个日志文件进行分析获取知识..由于日志具有数据量大,不易读懂的特点,如果仅凭借管理员查看日志记录的手段,其中所蕴含的有用信息也难以发现.分布式计算技术正好可以用来解决这一难题.阐述了syslogFl志收集流程,详细介绍了Hadoop分布式计算框架,设计并实现了一套基于Hadoop的网络日志分析系统.实验证明该系统是有效而实用的关键词:Hadoop框架;分布式;日志分析;sysl

3、og中图分类号:TP393文献标识码:A文章编号:1009—3044(2010)22—6163—02ResearchonHadoop一basedNetworkLogAnalysisSystemHUGuang—min.ZHOULiangi.KELi—xin(l.ModemInforiTiationandEducationTechnologyCenter,ShanghaiOceanUniversity,Shanghai201306,China;2.CollegeoflnformationScience,S

4、hanghaiOceanUniversity,Shanghai201306,China)Abstract:ViewingWeblogisanimportantmeasuretOinvestigatesystemfailuresandmmfitoroperatingstatusofthesystem.Administra一torscanexaminewhathappenedatacertaintime.theycanalsoanalyzeeachlogfileforpurposeofacquiringk

5、nowledge.Iftheadministra一toronlyreviewthestatusbyvirtueofcheckinglogfilesJtisdifficulttOfindusefulinformationthatcontainedinthosefiles,asthelogfilesischaracterizedbylargevolumeofdataanduneasytoread.DistributedcomputingtechnologycanbeusedtOsolvethisprobl

6、emexacdy.ProcessofSysloglogcollectionisexplained.detailsoftheHadoopdistributedcomputingframeworkisintroducedinthispaper.andaHadoop一basednetworkloganalysissystemisalsodesignedandimplemented.Experimentalresultsshowthatthesystemiseffectiveandpractical.Keyw

7、ords:Hadoopframework;distributed;loganaIysis;syslog随着计算机技术的发展,高校数字化建设的步伐越来越快,采用的系统越来越多,为了保护系统的安全,方便调查系统故障,监控系统运行状况,查看日志己经成为一个垂要的手段.管理员可以查看在某段时间内所发牛的事件,也可以通过对各个日志义件进行分析获取知识•由于日志具有数据量大,不易读懂的特点,如果仅凭借管理员查看H志记录的手段,其中所蕴含的有用信息也难以发现.挖掘出口志屮蕴藏的信息來改进用户体验提升管理水平是非常有

8、价值的,然而使用传统的技术对这些海量日志进行分析时无论在存储和计算量上都遇到了瓶颈,此时分布式计算技术进入了人们的视野.Hadoop作为着名开源组织TheApacheSoftwareFoundation旗下专注于分布式计算的开源项目最近广受业界的关注.在Yahoo!Hadoop被广泛应用到网页搜索,口志分析,广告计算和科学实验中•着名网站Facebook使用600个节点的Hadoop集群进行网站日志分析和数据挖掘,此外AOLJBM,Amazon等众多IT

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。