相关性分析技术在软件度量中的应用.pdf

相关性分析技术在软件度量中的应用.pdf

ID:52457407

大小:164.50 KB

页数:4页

时间:2020-03-27

相关性分析技术在软件度量中的应用.pdf_第1页
相关性分析技术在软件度量中的应用.pdf_第2页
相关性分析技术在软件度量中的应用.pdf_第3页
相关性分析技术在软件度量中的应用.pdf_第4页
资源描述:

《相关性分析技术在软件度量中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2008年2月陕西教育学院学报Feb.2008第24卷第1期JournalofShaanxiInstituteofEducationVol.24No.1相关性分析技术在软件度量中的应用¹丁剑洁(陕西教育学院数理工程系,陕西西安710061)摘要:数据分析是软件度量活动中的关键环节,不合理的数据分析会造成资源的浪费,更严重的是根据度量结果得到的决策信息会给软件组织带来误导,从而失去了软件度量的意义。相关性分析是数据分析中的一种重要方法,它能帮助确定软件不同属性之间是否存在关系。本文探讨了三种相关性分析技术在软件度量中的应用,归纳了相关性

2、分析技术的使用步骤,并给出应用实例。关键词:软件度量;相关性分析;Pearson积差相关系数;肯德尔和谐系数;最小二乘原理中图分类号:TP311.52文献标识码:A文章编号:1008-598X(2008)01-0100-041引言软件度量的目的是用软件度量学的方法来科学地评价软件质量,更有利地对软件开发过程进行控制和[1]管理,合理地组织和分配资源,制定切实可行的软件开发计划,降低成本获得高质量软件。从定性描述发展到定量分析是衡量一门科学是否成熟的指标。在软件度量活动中,数据分析是一个重要环节,数据分析在数学和物理学等众多领域中已经成

3、熟应用,但是由于软件度量本身是一门年轻的学科,因此数据分析技术的研究尚待完善,近年来有越来越多的研究人员关注这一课题。2关于软件度量软件度量的目的之一就是为软件项目量化管理提供决策支持。在软件工程的活动中,要面临很多决策[2]问题:测试团队需要找到最佳技术帮助他们在测试中发现更多的错误;开发人员想知道哪种开发技术对目前就要进行的项目是最合适的;维护人员想要知道模块规模和缺陷数之间是否存在一定关系,以便于为他们的维护工作提供参数。只有做出正确的决策,才能达到合理地组织和分配资源,制定切实可行的软件开发计划,降低成本获得高质量软件的目的。

4、决策的制定要有说服力就需要依赖数据,所以必须实施一系列的度量活动。在度量活动中我们需要进行一系列数据收集的繁琐工作,然后进行数据分析,如果数据分析作的不合理,就会造成资源和人力的浪费,更为严重的是据此所作的决策有可能会将我们后续的改进活动引入歧途。所以说,如何选取适当的数据分析技术,进行有效的数据分析,在软件度量中有很重要的地位。3常用的相关性分析技术软件度量中涉及的数据分析有多种,简单的如计算数据的平均数、中值、标准差、百分比等方法研究数据的性质和特性。另外,还可以使用比较成熟的统计学中的数据分析方法,例如相关性分析、传统的shew

5、hart[3-4]控制图等。本文的重点在相关性分析技术,主要用来揭示事物之间的关联性。软件过程本身是由多个事物参与受多种因素影响的过程,所以在做决策的时候应多方考虑,这时就可借助相关性分析来帮助决策者得到客观合理的结果。¹收稿日期:2007-11-07;修回日期:2008-01-03基金项目:陕西教育学院科研基金项目(07KJ42Q)作者简介:丁剑洁(1979-),女,陕西韩城人,陕西教育学院数理工程系助教,工学硕士。1003.1Pearson积差相关系数根据前面的论述,软件工程中的决策问题会受诸多因素的影响,这些因素往往含有一定的关

6、系,此关系可能并不能用某一确定的函数表示出来,需要用相关性分析作定量的研究,以便帮助我们做出正确的决策。20世纪初英国统计学家皮尔逊提出的一种计算两个变量线性相关的系数,称为Pearson积差相关系数,通常用r或rxy示,其作用是考察的两个变量x与y组成的二维随机向量(X,Y)的样本相关系数。若对(X,Y)作了n次观测,得到n对数据(x1,y1),,,(xn,yn)。Lxy则定义r为:r=。LxxLyynnnnn2211其中:Lxy=E(xi-x)(yi-y),Lxx=E(xi-x),Lyy=E(yi-y),x=nExi,y=nEyi

7、i=1i=1i=1i=1i=1当rrr=1时,X与Y存在完全的线性相关关系,意味着X与Y严格满足某个函数关系。rrr越小,X与Y存在线性相关程度越小,r=0,可以认为X与Y不相关(不存在线性相关),但不等于X与Y相互独立,X与Y之间可能存在其它形式的相关关系。在rrrX0时,若r>0,可认为X与Y正相关;若r<0,可认为X与Y负相关。3.2肯德尔和谐系数肯德尔和谐系数(thekendallcoefficientofconcordance)是计算多个等级变量相关程度的一种相关量,适用于数据资料是多列相关的等级资料,既可是k个评分者评N个

8、对象,也可以是同一个人先后k次评N个对象。通过求得kendall和谐系数,可以较为客观地选择好的产品或好的评估人员。以下用w表示肯德尔和谐系数(1)同一评价者无相同等级评定时,w的计算公式:Sw=123k(N-N)12式

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。