欢迎来到天天文库
浏览记录
ID:33234263
大小:939.88 KB
页数:58页
时间:2019-02-22
《基于数据挖掘的网页恶意代码检测技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号学号M200972548学校代号10487密级硕士学位论文基于数据挖掘的网页恶意代码检测技术研究学位申请人:鲍金霞学科专业:信息安全指导教师:李芝棠教授答辩日期:2012年1月11日AThesisSubmittedinFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringResearchonWebMaliciousCodeDetectingApproachesBasedonDataMiningCandidate:BaoJinxiaMajor:InformationSecuritySupervisor:P
2、rof.LiZhitangHuazhongUniversityofScience&TechnologyWuhan430074,P.R.ChinaJan,2012独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部
3、门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在_____年解密后适用本授权书。本论文属于不保密□。(请在以上方框内打“√”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日华中科技大学硕士学位论文摘要Web应用的日益增多,导致网页攻击日益猖獗,越来越多的恶意软件利用网页作为其传播载体,传播过程也越来越隐蔽,对用户造成了巨大的威胁。研究如何准确有效地检测网页恶意代码具有重要的意义。传统的基于网页内容或网址的静态检测方法由
4、于误报率高而缺乏实际应用价值,模拟真实运行环境的动态检测方法则因资源消耗大而难以获得较高的性能。基于数据挖掘的网页恶意代码检测技术,通过数据挖掘的方法生成一种漏报率较低的分类模型,希望通过将该分类模型与动态检测方法相结合,达到低误报率同时低漏报率的检测目标。通过对大量网页恶意代码的研究,分类型总结了网页恶意代码的特征。针对这些特征,采用了相应的特征提取技术:采用HTMLParser工具包提取HTML特征,采用正则表达式字符串匹配技术初步提取JavaScript特征,对经过混淆的JavaScript代码采用扩展的Rhino引擎进行特征的解析提取。由于Rhino引擎只提供了对核心
5、JavaScript功能的支持,详细研究了Rhino引擎的扩展技术。分类模型生成过程中,研究对比了朴素贝叶斯算法、决策树算法以及SVM算法的分类结果,同时研究了漏报率和误报率的调整,HTML特征与JavaScript特征分别进行分类所得结果的对比等。研究所得分类模型已应用于实际的检测系统,取得了良好的检测效果,针对检测过程中发现的问题,后续还将继续进行研究改进。关键字:网页恶意代码,数据挖掘,静态检测,脚本解析引擎-I-华中科技大学硕士学位论文AbstractAstheincreasingofwebapplications,webattacksareincreasing.Mo
6、reandmoremalicioussoftwarespreadthroughwebpages,andincreasinglysophisticated.Usersecurityisfacingahugethreat.Studyhowtoaccuratelyandefficientlydetectmaliciouswebcodeisofgreatsignificance.Becauseofhighrateoffalsepositive,traditionalstaticdetectionmethods,basedonwebcontentorURL,lackpracticala
7、pplicability.Meanwhile,dynamicdetection,simulatingarealrunningenvironment,isdifficulttoobtainahigherperformanceduetoresourceconsumption.Thedetectiontechnologyofmaliciouswebcode,basedondatamining,throughdataminingproducesaclassificationmodelwithlowerfalse
此文档下载收益归作者所有