欢迎来到天天文库
浏览记录
ID:57924575
大小:974.01 KB
页数:6页
时间:2020-04-14
《基于主题建模技术的克隆群映射方法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2015年6月计算机工程与设计June2015第36卷第6期COMPUTERENGINEERINGANDDESIGNVo1.36No.6基于主题建模技术的克隆群映射方法张瑞霞,张丽萍+,王春晖,侯敏(内蒙古师范大学计算机与信息工程学院,内蒙古呼和浩特010022)摘要:针对对源代码进行拷贝、粘贴及修改活动会导致软件中出现大量的克隆代码的问题,将主题建模技术应用于克隆代码,提出一种克隆群映射方法。运用主题建模技术将映射问题由高维的代码空间转化到低维的主题空间上,通过主题的映射间接实现映射相邻版本克隆群的目的。对4款开源软件进行方法评估,实验结果表明,使用该方法的查全率和查准率均高达0.99,其
2、能够有效准确地实现相邻版本的克隆群映射。关键词:克隆代码;软件演化;主题;主题建模;克隆群映射中图法分类号:TP311文献标识号:A文章编号:1000—7024(2015)06—1524-06d0i:1O.16208/j.issnl000—7024.2015.06.023ClonegroupmappingmethodbasedontopicmodelingZHANGRui—xia,ZHANGLi—ping+,WANGChun-hui,HOUMin(CollegeofComputerandInformationEngineering,InnerMongolmNormalUniversity,H
3、ohhot010022,China)Abstract:Theactivitiesoftheprogrammersincludingcopy,pasteandmodifyresultinlotsofcodecloneinthesoftwaresys—tems,aimingatthisproblem,thetopicmodelingtechniqueswereappliedintocodeclonefirstlyandaclonegroupmappingme-thodwasproposed.ByusingtopicmodelingtechniquestOtransformthemappingpr
4、oblemofhigh-dimensionalcodespaceintoalow-dimensionaltopicspace,thegoalofclonegroupmappingwasindirectlyreachedbymappingclonegrouptopics.Resultsofexperimentsonfouropensourcesoftwaresshowthattherecallandprecisionareupto0.99,thusthemethodcaneffectivelyandaccuratelyreachthegoalofclonegroupmapping.Keywor
5、ds:codeclone;softwareevolution;topic;topicmodeling;clonegroupmapping的克隆群映射方法多是基于文本或位置的相似度或两者结0引言合判断或利用版本管理工具(SVN、CVS)映射克隆群,程序员为了提高开发效率对源代码进行的拷贝、粘贴但这些方法存在准确率偏低、耗时较高、必须借助版本管及修改活动通常会导致软件中出现很多语法或语义特征相理软件中的日志等缺陷。本文将自然语言研究领域的主题同或相似的代码段,这类代码段被称为克隆代码(code建模技术应用于克隆代码,提出一种克隆群映射方法。主clone)E。为了更好的管理克隆代码,近年来学者们从
6、克题建模技术能充分利用源代码的文本和结构信息,将映射隆演化的角度,以动态的方式来探索克隆代码存在、发展、问题由高维的代码空间转化到低维的主题空间上,通过映变化的规律,即对同一软件系统多版本中的克隆进行跟踪,射主题来准确地构建相邻版本克隆群的映射关系。发现克隆在历时演化过程中表现出的模式和特征,为进一1克隆群及其映射方法步管理克隆提供依据。本文的克隆群映射方法正是根据克隆代码演化研究的1.1克隆群相关定义需要提出的,克隆群映射反映克隆群由前一版本到当前版现有研究中,克隆主要有以下两种分类方法l_2]。根据本的演化过程,是研究多版本演化的核心技术之一。目前检测粒度,将其分成:文件克隆、类克隆、函
7、数克隆、块收稿日期:2014—08—06;修订日期:2014一10—12基金项目:国家自然科学基金项目(61462071、61363017);内蒙古自治区高等学校科学研究基金项目(NJZYI3O48);内蒙古自然科学基金项目(2014MS0613);内蒙古师范大学科学研究基金项目(2013ZRYB06)作者简介:张瑞霞(1989一),女,内蒙古乌兰察布人,硕士研究生,研究方向为代码分析;+通讯作者:张丽萍(1
此文档下载收益归作者所有