钓鱼网页联合特征与智能检测算法研究与实现

钓鱼网页联合特征与智能检测算法研究与实现

ID:20763864

大小:3.29 MB

页数:74页

时间:2018-10-15

钓鱼网页联合特征与智能检测算法研究与实现_第1页
钓鱼网页联合特征与智能检测算法研究与实现_第2页
钓鱼网页联合特征与智能检测算法研究与实现_第3页
钓鱼网页联合特征与智能检测算法研究与实现_第4页
钓鱼网页联合特征与智能检测算法研究与实现_第5页
资源描述:

《钓鱼网页联合特征与智能检测算法研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级公开分类号TP181mXIANTECHNOLOGICALUNIVERSITY硕士学位论文题目:钓鱼网页联合特征与智能检测算法研究与实现:.作者贾雪鹏指导教师:容晓峰教授申请学位学科:计算机应用技术2018年05月02日密级公开分类号TP181硕士学位论文题目:钓鱼网页联合特征与智能检测算法研究与实现作者:贾雪鹏指导教师容晓峰教授申请学位学科(工程领域)计算机应用技术2018年05月02日钓鱼网页联合特征与智能检测算法研究与实现学科:计算机应用技术研究生签字:指导教师签字:摘要钓鱼网页

2、欺诈是现代网络犯罪的主要手段。近几年,钓鱼网页攻击发生的次数显著上升,并在2017年创下历史新高。钓鱼网页攻击可以让诈骗方用最低的成本进行网页攻击部署,使其在短时间内进行大规模传播。为了保护互联网用户的信息安全免遭泄露,研究确定更加准确和有效的基于机器学习技术的自动网页检测方法来抵抗这种快节奏的网络攻击就显得至关重要。本文主要研究使用多来源的特征训练出能够有效检测钓鱼网页的分类模型。其中,分别从URL链接、网页内容元素和第三方网页相关信息这三个来源派生特征,对其进行特征提取、特征选择和特征重要度计算,得到基础特征。为了使分类模型表达出对网页更加丰富的细粒度的描

3、述,引入联合特征率R(0

4、治思想,将训练集中大规模未标记数据平均拆分为多个子数据集,依次在这些子数据集上对分类模型进行递归训练,得到最终分类模型。本文通过对比了多种分类模型在改进自训练方法中的分类效果和运行时间,与传统自训练方法相比,改进的自训练方法能够有效地检测钓鱼网页,并在保证分类效果与传统自训练方法持平的基础上,方法运行时间相比于传统自训练平均降低50%以上,实现了更优的方法时效性,为缺少大规模可靠标记数据和在线检测等场景提供了一种新的研究思路。关键词:钓鱼网页检测;机器学习;联合特征;最优分类模型;自训练方法ResearchandImplementationonJointFea

5、turesandIntelligentDetectionAlgorithmsofPhishingWebpagesDiscipline:ComputerApplicationTechnologyStudentSignature:SupervisorSignature:AbstractPhishingWebpagefraudisamajortrickofcriminalinthemodernInternetworld.Inrecentyears,thenumberofwebpageattackshasbeenrisingsignificantly,andhitar

6、ecordhighin2017.Attackerscandeployawebpageattackatthelowestcost,andallowingittospreadonalargescaleinashortperiodoftime.InordertoprotecttheinformationsecurityofInternetusers,itiscrucialtostudymoreaccurateandrapidautomaticwebpagedetectionmethodstoresistthisfast-pacedcyberattack.Inthis

7、dissertation,theclassificationofphishingwebpageswasinvestigatedusingfeaturesderivedfromthreesources:URL,webcontentelementsaswellasrelativeinformations,andfeatureextraction,featureselectionandfeatureimportancecalculationareperformedonthesefeatures.Inordertomaketheclassificationmodels

8、expressricherfine-g

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。