欢迎来到天天文库
浏览记录
ID:33789619
大小:1.42 MB
页数:57页
时间:2019-03-01
《基于dns访问记录挖掘的用户群划分》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、单位代码:10293密级:公开硕士学位论文论文题目:基于DNS访问记录挖掘的用户群划分学号1010041011姓名杨康导师张伟学科专业信息安全研究方向计算机通信网与安全申请学位类别硕士论文提交日期2013-2-26UsergroupingbasedonDNSvisitrecordsminingThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByYangKangSupervisor:Prof.ZhangWeiSubm
2、issionDate:February26th,2013南京邮电大学学位论文原创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。本人学位论文及涉及相关资料若有不实,愿意承担一切相关的法律责任。研究生签名:___________日期:____________南京邮电大学学位论文使用授权声
3、明本人授权南京邮电大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档;允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索;可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容和纸质论文的内容相一致。论文的公布(包括刊登)授权南京邮电大学研究生院办理。涉密学位论文在解密后适用本授权书。研究生签名:__________导师签名:____________日期:_____________摘要随着计算机网络的快速蓬勃发展,信息量以极高的速度增长着,积累了海量的数据。从海量的数据中发现有价值的信息成为了一大难题
4、。数据挖掘即是从大量数据中提取出潜在的、有价值的知识的过程。Web挖掘可以被看作是数据挖掘应用于Web数据时的泛称,DNS挖掘属于Web挖掘中Web日志挖掘的范畴。DNS访问记录体现了网络用户的访问意图。DNS挖掘可以从用户的DNS访问记录中抽取出感兴趣的访问模式,以达到用户群划分的目的。在研究数据挖掘理论的基础之上,为满足通过挖掘大量DNS数据来实现用户分析、用户识别的需要,本文提出了一个完整的DNS挖掘系统设想,并围绕着实现这一设想深入开展一系列的研究工作。首先,本文深入研究了经典的Apriori关联规则挖掘算法,针对其缺点进行改进,并用改进后的算法
5、对DNS数据进行挖掘,发现了一系列零散的用户特征。为了满足深入研究的需要,进而引入域名分类机制、提出模式指纹的概念,并对其所应包含的要素进行了分析和论述。接着,本文详细介绍了经典的K-Means聚类算法,具体分析了其原理及缺点不足,并阐述了国内外学者对其改进所做的努力和成果。之后,采取聚类有效函数与随机重启动相结合的方法改进K-Means算法对模式指纹进行聚类,供后续研究使用。然后,本文深入研究了决策树分类技术,阐述了决策树分类中最常见且十分重要的过度拟合问题,在详细分析了其产生原因后,提出了“选样剪枝”方法,并将其运用于经典的C4.5决策树算法,通过实
6、验证明这种方法的有效性,进而将其应用到DNS挖掘中。最后,基于上述的研究成果,本文设计了一个DNS挖掘程序,基于域名分类机制分析产生用户行为模式指纹,采用改进后的K-Means算法对用户进行聚类,之后采用“选样剪枝”方法改进的C4.5决策树算法进行分类,进而完成用户群划分的功能,对测试结果进行了深入分析和总结,并对DNS挖掘的前景进行了展望。关键词:DNS访问记录挖掘,关联规则,用户行为模式,聚类分析,决策树IAbstractWiththeboomingofInternet,theamountofinformationisgrowingataveryhi
7、ghspeed,andvastamountsofdataareaccumulated.DataMiningistheprogressofdiscoveringusefulinformationfromalargenumberofdata.WebMiningcanbeseenasDataMiningappliedinWebarea.DNSMiningbelongstoWebMining,andisakindofWebLogMining.DNSvisitrecordsreflectsthenetworkuser’sintention.ThroughDNSMi
8、ningwecanfindthenetworkuser’sbrowsingpat
此文档下载收益归作者所有