软件漏洞源代码的语义标注技术研究

软件漏洞源代码的语义标注技术研究

ID:18178774

大小:2.00 MB

页数:63页

时间:2018-09-15

软件漏洞源代码的语义标注技术研究_第1页
软件漏洞源代码的语义标注技术研究_第2页
软件漏洞源代码的语义标注技术研究_第3页
软件漏洞源代码的语义标注技术研究_第4页
软件漏洞源代码的语义标注技术研究_第5页
资源描述:

《软件漏洞源代码的语义标注技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级公开分类号TP3911.m'XIANTECHNOLOGICALUNIVERSITY|硕士学位论文题目:软件漏洞源代码的语义标注技术研究'作者s王许指导教师:容晓峰教授’申请学位学科:计算机软件与理论2018年5月4日密级公开分类号TP391.1XI’ANTECHNOLOGICALUNIVERSITY硕士学位论文题目:软件漏洞源代码的语义标注技术研究作者:黑体王4号许指导教师:容晓峰教授申请学位学科:计算机软件与理论2018年5月4日软件漏洞源代码的语义标注技术研究学科:计算机软件与理论研究生签字:指导教师签字:摘要近年

2、来随着信息技术的发展,软件技术也得到了飞速的发展,软件的数量和规模都在不断的扩张。相应的软件中存在的漏洞也越来越多,据美国统计平均一千行到一千五百行代码中,人类编程人员就会在其中留下一个软件安全漏洞。与软件技术的飞速发展相反,软件漏洞的检测技术已处于瓶颈期,时至今日依然用传统的静态、动态或动静结合的检测方法。传统的漏洞检测技术已经跟不上软件技术的发展。伴随着软件数量的增多,被挖掘出来的软件漏洞数量也越来越多,目前世界上信息产业发达的国家都建有自己的漏洞数据库,某些企业和组织也建有自己单独的漏洞数据。这些漏洞数据库大多都遵循CVE标准相互兼容,如此以来就产生了很大的漏洞数据。那么如何合理利用

3、现有的漏洞数据,为漏洞的检测提供新的方法越来越是我们需要面对的一个问题。结合当前的大数据技术,对漏洞数据进行分析挖掘是利用这些漏洞数据的方式之一。但是当前的漏洞数据以非结构化的方式存在于漏洞数据库中,不利于计算机的直接处理,因此本文对这些漏洞数据进行预处理使其能被计算机直接处理。为以后基于大数据技术的漏洞模式挖掘提供支撑。本文利用语义标注技术对漏洞数据进行预处理。语义标注技术在图像语义、语义Web等领域已经得到大量的研究,也得到了一定的研究成果,但是在漏洞源码领域尚未发现相关的研究。语义Web利用语义标注技术将非结构化的Web文档转化成结构化的RDF文档,结构化的文档方便计算机对其直接处理

4、,在结合本体技术就能实现计算机对Web文档的理解功能。大数据处理技术也要求数据具有一定的结构。因此对漏洞源码的语义标注就是要将纯文本的源码文件转化成结构化的源码文件,在本文中我们将其转化为XML格式的文件。在进行标注时本文主要做了以下工作:(1)待标注实体的识别。对漏洞源码的标注首先要找到待标注的对象,本文对漏洞数据库中的漏洞源码信息进行了详细的研究,首先确定了待标注信息的组成,漏洞信息由两部分组成,一部分是漏洞描述信息,另一部是漏洞源码本身。确定了待标注的信息范围,接下来识别待标注信息中的待标注对象。其中最为关键的是对漏洞源码信息中实体的识别,本文以抽象语法树为依据对漏洞源码中的实体信息

5、进行识别。(2)标签设计。对于所识别的每一个实体,依据实体类别设计相应的标签。本文对漏洞源码的编程语言进行详细的研究,对程序中的每一种元素进行归类表示,每一类元素制定相应的标签,并确定标签的子标签,属性等信息。(3)语义体现。在语义Web中语义信息主要由现有的本体体现,图像的语义标注中语义就是图像的类别。在本文中我们以标签的意义作为漏洞源码语义标注的语义体现。最后为了验证本标注方法的有效性,我们进行实验,在本文所提出的标注方法的基础上进行漏洞的模式挖掘,实验结果显示所挖掘出的漏洞模式与原漏洞模式一致,证明本标注方案具有一定的可行性。关键词:语义标注技术;软件安全漏洞;抽象语法树;XML技术

6、ResearchontheSemanticannotationofSoftwareVulnerabilitySourcecodesDiscipline:ComputerSoftwareandTheoryStudentSignature:SupervisorSignature:AbstractRecently,withthedevelopmentofinformationtechnology,softwaretechnologyisalsodevelopingrapidly,andthenumberandscaleofsoftwareisconstantlyexpanding.Corresp

7、ondingtosoftware,however,occurringmoreandmorevulnerabilities.AccordingtothestatisticsoftheUnitedStates,onaverage,fromonethousandlinestoonethousandandfivehundredlinesofcodes,humanprogrammerswillleaveasoftwarevulne

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。