资源描述:
《粒计算在数据挖掘中属性约简的应用研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、太原理工大学硕士学位论文粒计算在数据挖掘中属性约简的应用研究姓名:白琳林申请学位级别:硕士专业:计算机应用技术指导教师:胡彧20090301太原理工大学工学硕士研究生学位论文粒计算在数据挖掘中属性约简的应用研究摘要数据挖掘是从大型数据库中提取隐含的、预先不知道的、潜在有用的信息。属性约简作为粒计算、粗糙集等软计算理论中关键的一部分,在数据挖掘起着非常重要的作用,一个好的属性约简算法,可以减少计算的复杂度,提高数据挖掘的效率。粒计算作为近年研究领域的热点之一,为数据挖掘研究的许多方面提供了理论上的框架。近年来,许多学者从各自不同的学科领
2、域对粒计算进行了深入的研究,并取得了很多成果。本文运用粒计算的思想和方法,提出了一种新的快速属性约简算法—FARA(FastAttributeReductionAlgorithm)。算法包括运用基于回溯的基数排序算法求不可分辨关系、求正域、求核、求属性约简四个部分。其中求核的时间复杂度成功地降为O(
3、C
4、
5、U
6、),然后,运用改进的属性重要度作为启2大程度上减少了约简所花费的时间,提高了约简的效率。另外,在此过程中,通过严密的定理和推论证明了算法的正确性和高效性。作为课题的一部分,我们设计开发了FARA对应的属性约简系统—FARS(Fa
7、stAttributeReductionSystem)。在系统中除实现了FARA外,还实现了作者刘少辉等在文献[32]中提出的高效完备的属性约简算法,及徐章艳等在文献[33]提出的快速约简算法,以和本文FARA进行详细的比较。I发信息,得到求属性约简的算法的时间复杂度为O(
8、C
9、
10、U
11、)。因此,算法在很太原理工大学工学硕士研究生学位论文最后,运用UCI机器学习库中的一些数据集对三种算法进行测试,通过对测试结果的分析,证明了FARA对大型的数据集进行属性约简的高效性。关键词:粒计算,属性约简,粗糙集,数据挖掘II太原理工大学工学硕士研究
12、生学位论文RESEARCHONATTRIBUTEREDUCTIONINDATAMININGBASEDONGRANULARCOMPUTINGABSTRACTDataminingconcentratesonexploringimplicit,previouslyunknown,andpotentiallyusefulinformationfromlargedatabases.Asacrucialpartofgranularcomputing,roughsetandothersoftcomputingtheories,attributere
13、ductionplaysaveryimportantroleindatamining.Anexcellentalgorithmcoulddecreasethecomplexityofcomputingandimprovetheefficiencyofdatamining.Granularcomputing,asanemergingresearchfield,providesagoodtheoreticalframeworkforissuessolvingindatamining.Inrecentyears,granularcomput
14、inghasbeenstudiedbymanyscholarsfromtheirownareasandlotsofacademicachievementshavebeengained.Inthispaper,withgranularcomputing’soverviewandmethods,anewalgorithmforattributereductionisproposedandnamedasFARA(FastAttributeReductionAlgorithm).Itinvolvesfourprocedures,suchasg
15、ainingindiscernibilityrelationthroughbacktrackingradixsortingalgorithm,gainingpositiveregion,gainingcore,gainingattributereduction.ThetimecomplexityforcomputingcoreissuccessfullycutdowntoO(
16、C
17、
18、U
19、).Furthermore,thequickreductionalgorithmwhichusesimprovedattributesignifica
20、nceasheuristic2attributereductioncouldbelesseneddownandtheefficiencyboughtup.InIIIinformationispresented,theti