面向网络渗透社工的用户信息挖掘与分析

面向网络渗透社工的用户信息挖掘与分析

ID:35102262

大小:4.22 MB

页数:86页

时间:2019-03-17

面向网络渗透社工的用户信息挖掘与分析_第1页
面向网络渗透社工的用户信息挖掘与分析_第2页
面向网络渗透社工的用户信息挖掘与分析_第3页
面向网络渗透社工的用户信息挖掘与分析_第4页
面向网络渗透社工的用户信息挖掘与分析_第5页
资源描述:

《面向网络渗透社工的用户信息挖掘与分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:10385分类号:研究生学号:1300205013密级:不保密面向网络渗透社工的用户信息挖掘与分析UserInformationMiningandAnalysisOrientedTheSocialEngineeringNetworkPenetration作者姓名:姜楠指导教师:郑力新教授实践单位导师:黄惠荣高级工程师专业学位类别/领域:工程硕士/计算机技术研究方向:网络安全所在学院:工学院论文提交日期:二零一六年三月三十日摘要随着互联网安全技术的发展,系统漏洞的发现越来越困难,越来越多的入侵者采用人为因素变相地创造漏洞进行攻击,这在一定程度上扩大了社会工程学的应用范围。网

2、络渗透社工的核心思想是找到系统人员的疏忽之处从而制造漏洞。对于渗透社工而言,完整、真实的用户信息是决定后期能否成功渗透的关键。课题研究如何从庞大的网络数据中运用数据挖掘的方法分析出合法有用的用户信息建立社工库,目标是能根据渗透社工的需求设计完善的查询界面,通过检索获取有效信息。然而用户信息的挖掘存在各种困难,包括非结构化、跨网站性和非度量化。针对这些难题本文进行深入研究,主要研究内容概括如下:(1)针对用户信息的非结构化,本文研究了基于网站用户信息提取的爬虫技术,设计一个可以良好运行的爬虫系统,通过模拟登陆获取访问权限实现对非结构用户信息的有效提取。(2)针对跨网站的用户信息,本文

3、研究了跨网站的用户匹配技术。该模块的设计通过对具有唯一值的性别、年龄等信息进行精准匹配,对具有限制性的用户名采用模糊匹配,解决跨网站导致的用户信息碎片化问题,并针对现有的模糊匹配算法准确率低的缺点提出改进,最终实现同名消歧和不同名消解。(3)针对用户信息的非度量化,课题采用正则匹配融合Python现有模块实现文本内容提取,利用文本挖掘技术实现对用户信息的度量。针对Fast-Newman聚类算法无法识别小于特定规模的网络类和极端退化的现象提出改进,最终通过GN基准网络进行性能测试证实算法的有效性。(4)从应用的角度出发,在非结构化、跨网站化、可度量化的用户信息的基础上,选择具有良好接

4、口和兼容性的数据库对相关数据进行封层存储,设计一个完善的存储系统有效存储数据的同时可以实现快速检索。课题从上述四个问题进行研究、解决并取得了一些初步成果。随着挖掘技术的不断完善,挖掘出来的信息会为各种社会化应用带来更大的帮助。关键词:数据挖掘用户信息爬虫模糊匹配文本挖掘IAbstractWiththedevelopmentofsafetytechnology,theuseofloopholesinsystemintrusionbecomesincreasinglydifficult.AgrowingnumberofintrudersmakeSocialEngineeringinne

5、tworkpenetrationmoreandmorecommonbyusingthehumanfactortopreparefortheattack,andtocreatealoopholeindisguise.Socialnetwork’scoreideaistofindthenegligentusersorpsychologicalweaknesses.Forpermeatesocialworkers,completeandrealpersonalinformationisthekeydeterminantofsuccessfulpenetration.Thelegitima

6、teuserprofileinformationusefultoestablishadatabasegoal,toimprovethepenetrationqueryinterfaceaccordingtotheneedsofsocialworkers.However,therearevariousdifficultiesinmininguserinformation,includingunstructuredproblems,difficultiesandnon-cross-sitequantificationproblems.Inthispaper,theseproblemsh

7、avebeenstudiedandthemaincontentsaresummarizedasfollows:(1)Fortheunstructureddifficulties,web-baseduserinformationextractioncrawlertechnologywillbestudiedinthispaper.Wecandesignawell-functioningcrawlersystemandthuseffectivelycarryouttheu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。