数据挖掘研究

数据挖掘研究

ID:44509561

大小:113.23 KB

页数:7页

时间:2019-10-22

数据挖掘研究_第1页
数据挖掘研究_第2页
数据挖掘研究_第3页
数据挖掘研究_第4页
数据挖掘研究_第5页
资源描述:

《数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、****大学专业文献综述题目:姓名:学院:t业:级:学号:成绩:指导教师:数据挖掘研究综述廿算机与信息工程学院电子信息科学与技术职祢:2013年I月I日"I大学教务处制数据挖掘研究综述作者指导教师摘要:在屯信系统中,经常需要根据用户的登入登出进行计时收费,这样我们就需要根据登录口志來将用户的登入记录和登出记录按照对应关系匹配起來,形成一条完整的登录记录,登录记录屮包含以下信息:用户登录名,登入时刻,登出时刻,登录时长,登录终端机器IP等。在匹配过程中,理论上一条登入记录跟一条登出记录匹配,但有可能在我们采集数据吋用户还没有登出,所以日志文件屮可能出现没冇登

2、出记录与之匹配的登入记录,这些登入记录我们将其保存在一个指定的文件中,在下次采集时再读取。在整个电信系统中,这些记录无疑是非常巨大的,不是依靠人力手工能够完成的,这时,我们就需要冇一个具体的系统来帮我们自动完成这些功能,这也就是本次课题的选择一一数据挖掘系统(DataMiningSystem)。L1J关键词:数据挖掘;客户端;服务器端TheSummaryofDataMiningTurtor:Abstract:Intelecommunicationssystem,oftencarriedouttimechargesbasedonuser^sloginorlo

3、gout,soweneedtomatchtheuser'sloginandlogoutrecordsbycorrespondencerelationshipaccordingtothelogandformacompletelogrecords,logrecordcontainsthefollowinginformation:userloginname,logintime,logouttime,loglength,logterminalmachineIPandsoon.Intheprocessofmatching,intheory,aloginrecordm

4、atcheswithalogoutrecord,butwhenwecollectthedatatheusermaynotlogout,sotheremaybenologoutrecordmatchwiththeloginrecordinthelogfile.Wesavetheloginrecordsinadesignatedfile,andreadthematthenextcollection.Inthewholetelecommunicationssystem,theserecordswillundoubtedlybeverytremendous,tor

5、elyonhumanhandcannotbedone,thenweneedaspecificsystemtohelpusfinishthesefunctionsautomatic,itisthechoiceofthissubject--DataMiningSystem.随着计算机及互联网技术的高速发展,一些大的厂家例如电信,推出了服务器出租这项业务,选择这项业务的用户可以通过远程登录服务器上进行自己的工作。服务器出租就是指用户不需要自己购买服务器,只需要根拯自己的业务要求,向运营商申请-个帐号通过远程登录,便可以轻松享用服务器。由于服务器的价格相当昂贵,所

6、以更多的用户更倾向于选择租用,而不是购买。这样服务器出租便得到了广泛的发展。这时就需要一款运行在服务器上的计时软件,来统计用户的使用情况來做出和应的收费依据。⑵在此背景下,电信计费系统便应运而生了。1数据挖掘的意义在电信系统屮,经常需要根据用户的登入登出进行计吋收费,这样我们就需要根据登录口志來将用户的登入记录和登出记录按照对应关系匹配起來,形成一条完整的登录记录。在匹配过程屮,理论上一条登入记录跟一条登岀记录匹配,但有可能在我们采集数据时用户还没有登出,所以日志文件中可能出现没有登出记录与之匹配的登入记录,这些登入记录我们将其保存在一个指定的文件屮,在下

7、次采集时再读取。在整个电信系统中,这些记录无疑是非常巨大的,不是依靠人力手工能够完成的,这时,我们就需要有一个具体的系统来帮我们口动完成这些功能,这也就是本次课题的选择数据挖掘系统(DataMiningSystem)。电信计费系统是专门为服务器租赁商开发研究的,租赁商只需要出租的服务器上安装木系统,就会有相应的数据从客户端源源不断发送到服务端,这样便可以轻松的了解各地服务器的运营状况,以及盈亏情况,同时也可以作为用户缴纳费用的依据。2数据挖掘技术由于用户数量巨大,所有用户信息保存在非结构型日志文件中。如何从海量数据屮找到某一用户的计费信息,就需要数据挖掘技

8、术的支持。2.1数据挖掘技术的基本知识数据挖掘(DataMinin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。