软件知识库中数据挖掘的运用探析,计算机应用技术论文

软件知识库中数据挖掘的运用探析,计算机应用技术论文

ID:9438904

大小:52.00 KB

页数:3页

时间:2018-04-30

软件知识库中数据挖掘的运用探析,计算机应用技术论文_第1页
软件知识库中数据挖掘的运用探析,计算机应用技术论文_第2页
软件知识库中数据挖掘的运用探析,计算机应用技术论文_第3页
资源描述:

《软件知识库中数据挖掘的运用探析,计算机应用技术论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、软件知识库中数据挖掘的运用探析,计算机应用技术论文文章首先介绍了数挖掘技术,同时将该技术与软件工程相联系,指出了将数据挖掘技术应用到软件知识库中的重要性,并从软件知识库的开发与应用两方面入手,对其具体应用手段与过程进行了分析。    引言    计算机以及信息技术的不断发展,使得数据挖掘技术逐渐出现,将其应用到软件工程的软件知识库中,能够使知识库中的数据得到优化管理与使用,对于软件使用效率的提高极为有利,对该技术具体应用的研究,是提高其应用水平的基础。    1数据挖掘技术    数据挖掘即在大量模

2、糊的、不完全的、有噪声的数据中,提取出有效知识的一个过程,而数据挖掘技术,则是基于上述过程所产生的一种技术[1].数据挖掘技术与统计分析具有一定的类似性,但并不完全相同,相对于后者而言,前者具有更大的先进性与优化性,能够实现对图片乃至声音的挖掘。    数据挖掘技术的应用包括数据预处理、数据挖掘以及模式评价与知识表示等步骤。数据库、数据仓库、万维X以及其他信息存储库中的信息,会通过数据库与数据仓库服务器,进入到知识库当中,通过数据挖掘引擎,实现数据挖掘,并在完成模式评估的基础上,传输到用户界面,最终

3、完成数据挖掘过程。    2数据挖掘与软件工程    软件的开发、应用以及维护过程,会产生大量的数据。以软件开发为例,其中主要包括任务数据、资源数据以及源代码数据等。而其应用过程数据量更大。如何对数据进行存储处理,是软件领域面临的主要问题。采用软件配置管理系统以及缺陷跟踪系统等,能够实现对数据的管理,但效率相对较低。采用数据挖掘技术,能够实现对软件整个生命周期的管理。从软件的分析设计入手到密码、调试、测试与错误检验的迭代开发过程,再到软件的维护,均可以采用该技术对软件工程数据进行处理,通过将其存储到

4、软件库中的方法,采用分类分析、关联分析、聚类分析以及概念分析等方法,完成数据挖掘过程,提高软件运行效率以及使用性能[2].    3数据挖掘技术在软件知识库中的应用    3.1数据挖掘技术在软件知识库开发中的应用    在软件开发过程中,为最大程度满足用户需求,开发人员需要不断演化源代码,这一过程需要以框架的形式,对软件进行管理,因此通常需要大量的文档数据作为保证[3].传统开发过程中,文档的缺乏会对开发过程造成极大的阻碍,增加其困难性。采用数据挖掘技术,可以使开发人员及时的获取相应文档,是提高软

5、件开发效率的主要途径。    数据挖掘技术在软件开发中的应用,需要经过构架理解过程以及系统反射框架过程,使源代码注解到程序静态依赖图,进而使软件的开发过程得以顺利完成。在开发完成之后,需要采用实验的方法,对结果进行评价,在建立评价标准的基础上,对实验结果进行分析,以判断数据挖掘技术应用的有效性。实验过程需要硬件作为支持,CPU、硬盘、软件环境以及实验软件平台均需要选用最新型的技术。以软件环境为例,可采用Windows7或以上,为软件运行提供保证。可采用java语言编写算法完成实验。    3.2数据

6、挖掘技术在软件知识库维护中的应用    软件知识库的维护对于软件性能的保证极为重要,是需要贯穿与软件整个生命周期的过程,采用传统技术实现软件的维护,难度较大,效率较低,且维护效果相对较差。计算机的运行所面临的环境十分复杂,维护人员必须时时刻刻关注系统状态,并对其加以优化,这样才能维持软件运行的稳定性。随着软件使用时间的延长,其中所包含的数据也越来越多,维护也就变得越来越困难。采用数据挖掘技术,实现对软件知识库的维护,能够达到提高维护效率,降低维护成本的目的。    采用SVN作为版本控制工具,并采用

7、Bugzilla作为主要的软件跟踪系统,能够实现对软件源代码的跟踪,但相对而言,跟踪难度较大。采用数据挖掘技术,将决策树学习应用到数据挖掘过程中,能够使噪声数据得到更加准确的识别与判断,是提高数据识别准确度的主要算法之一。CART与ID3是使用较为广泛的两种决策树形式[4].以ID3算法为例,基于信息增益方法,能够确定每个节点时所需要的合适属性,能够使信息量达到最小化,进而最大程度的提高数据挖掘效率。    为判断上述数据挖掘技术在软件知识库维护中应用的有效性,需要采用实验的方法,对结果进行合理分析

8、。实验过程需要硬件作为支持,CPU、硬盘、软件环境以及实验软件平台均需要选用最新型的技术。实验完成之后,要合理分析结果,并得出准确结论。    4结论    传统方法在软件知识库中的应用,具有较大的缺陷,主要体现在开发与维护效率不高以及成本过大方面,采用数据挖掘技术实现软件知识库的开发与维护,可以有效解决上述问题,不仅能够提高效率、同时还能够降低开发与维护难度,降低其成本。鉴于数据挖掘技术的上述优势,应将该技术广泛应用于软件知识库的开发与维护过程中,以提高开发与维护的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。