基于数据挖掘的局域网络用户行为分类的研究

基于数据挖掘的局域网络用户行为分类的研究

ID:37028341

大小:222.52 KB

页数:8页

时间:2019-05-15

基于数据挖掘的局域网络用户行为分类的研究_第1页
基于数据挖掘的局域网络用户行为分类的研究_第2页
基于数据挖掘的局域网络用户行为分类的研究_第3页
基于数据挖掘的局域网络用户行为分类的研究_第4页
基于数据挖掘的局域网络用户行为分类的研究_第5页
资源描述:

《基于数据挖掘的局域网络用户行为分类的研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于数据挖掘的局域网络用户行为分类的研究席卓,何刚**510(北京邮电大学信息与通信工程学院,北京100876)摘要:利用数据挖掘的技术,对局域网络用户的用户行为进行深层发掘。本文使用从局域网络综合管理系统提取的用户行为原始数据,将数据进行相关处理后,针对数据的结构和内有特点,依据Leader-follower、K-means算法自己编程实现了对数据进行聚类分析,从海量数据中深入发掘有价值的信息。根据对局域网内用户在上班、下班时段页面浏览次数的聚类分析结果,对用户行为进行分析与分类,得出一定时间段内用户行为规律,并依据

2、该聚类结果对异常网络行为进行识别。结果表明:该聚类方法能很好的对用户行为进行分类,达到了预期。关键词:数据挖掘;用户行为分类;局域网;Leader-follower;K-means中图分类号:TP393.115ResearchofLANuserbehaviousclassificationbasedondataminingXIZhuo,HEgang(SchoolofInformationandCommunicationEngineering,BeijinguniversityofPostsand2025303540Tel

3、ecommunications,Beijing100876)Abstract:Basedonthedataminingtheory,thethesismakesadeepresearchonLANuserbehaviousclassification.ByusingthedatacollectingfromLANmanagementsystem,theauthorrealizedtheLeader-follower,K-meansalgorithmsandexploreedvaluableinformation.Then,

4、thethesisanalysesclustedresultofnumberofLANusers'viewingwebpageandgetsomeregularpatternsforthenetworkbehavious.Theresearchshowsthattheclusteranalysisisaapplicablemethodfornetworkuserbehaviousclassification.Keywords:Dataminig;Userbahaviousclassification;LAN;Leader-

5、follower;K-means0引言近年来,随着网络的普及和网络应用的层出不穷,互联网已经成为人们获取知识,社会交流的平台,而且其重要性也越来越重要。而以企事业单位、学校或一个机构为单位的局域网,在其中扮演着十分重要的角色。局域网能够提供稳定,高带宽的网络环境,便于同一局域网内的用户使用,但是它的弊端也随着越来越多的应用而出现。例如,一个公司使用一个局域网,但是无法确定那些员工在上班时间在工作还是从事与工作无关的网络行为,如浏览网页,大量收发邮件或网络发帖。在一些情况下,与工作无关的行为,如BT下载,在线音乐或在线视频点

6、播不仅影响员工的工作效率,而且有时还会占用大量的正常带宽,破坏的网络环境,对正常工作的员工造成很大的影响。所以,研究一个局域网内大量用户的网络行为,并使用数据挖掘技术对某些类似的行为归为同类,将差异很大的行为视为不同类,能够有效的达到对不同的网络行为进行区分的目的。依据对某特定局域网内用户行为的分类结果,网络管理员能够清晰的了解到当前网络用户的网络使用情况,做到精确定位,差别化指定网络使用策略,提高网络的使用效率和环境。作者简介:席卓,(1985-),男,主要研究方向:宽带IP。通信联系人:何刚,(1971-),男,副教授

7、,主要研究方向:宽带IP网络.E-mail:brianhe@bupt.edu.cn-1-1数据挖掘技术简介1.1数据挖掘的概念数据挖掘(DataMining)是指从大量的、不完全的、有噪声的、模糊地、随机的数据45505560中,提取隐含在其中的、人们不知道的、但又拥有潜在有用信息和知识的过程。这些知识一般可表示为概念(Concepts)、规则(Rules)、规律(Regularities)和模式(Patterns)等。它是一门交叉性学科,涉及到机器学习、模式识别、归纳推理、统计学、数据库、数据可视化和高性能计算等多个

8、领域。因为数据挖掘涉及的学科领域和方法很多,有多种分类方法。根据挖掘任务,可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等[1]。1.2数据挖掘的功能数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程,这些模型和关系可以用来

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。