欢迎来到天天文库
浏览记录
ID:45783573
大小:140.98 KB
页数:51页
时间:2019-11-17
《基于粗糙集特征选取算法研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、摘要特征选取是数据挖掘、机器学习和模式识别屮的一项重要技术,在数据准备和预处理过程中发挥着重要作用。它能够删除原始数据中的兀余属性,起到提高学习的准确性和减少学习的时间的效果。粗糙集理论是一种处理不确定和模糊知识的重耍数学工具,它能在无任何先验信息的条件下,通过知识约简得到问题的决策。近來,粗糙集理论在特征选取算法中得到了广泛的应用,算法的有效性和应用成为了研究的热点。针对判断两个正区域相等算法的低效性问题,实现了一种高效的正区域相等判定算法。在此基础上,实现了一种基于相关信息量的特征选取算法。针对止区域计算过程中存在不一致数据信息丢失的问题,实现了一种将非一致性数
2、据进行归类处理的方法。然后针对现有的粗糙集特征选取算法仅仅单独考虑属性的重要性存在的问题,通过将属性的重要性和规则支持度相结合的方式进行特征评价。最后,在前面研究的基础上实现了一种基于支持度的特征选取算法,并用国际机器学习数据库屮的数据验证了算法的有效性。为了检验算法的实用性,设计并实现了一个知识发现原型系统,将基于相关信息量的特征选取算法和基于支持度的特征选取算法集成到系统的特征选取模块中。通过客户关系管理屮的一个应用实例说明了特征选取算法在客户数据屮的处理方式和特征选取结果的实用性。关键词:粗糙集,特征选取,属性约简,属性核AbstractFeaturesele
3、ctionisoneofmostimportanttechniqueindatamining,machinelearningandpatternrecognition.Itremovesirrevalentandredundantfeaturesbygivenevaluationcriterion.Thereducedattributesbringtheimmediateeffectsforapplication:speedupdataminingalgorithmandimprovingpredictiveaccuracy.Roughsetisanimportan
4、tmathematicaltooltodealwithvaguenessanduncertaintydata.ltrevealsknowledgefromoriginaldatawithoutanyrestrictcondition.Recently,Roughsettheoryhasbeenappliedtofeatureselectionsuccessfully,theflexibilityandapplicationofalgorithmbecomesahotdiscusseddirection.Toovercomethedefectoftheineffici
5、encyofpositiveareacompare,Ahighefficiencypositiveregionkeepingalgorithmisrealized.Basedonaboveresearch,aheuristalgorithmbasedoncorrelationinformationvectorisrealized.Toovercomethedefectoflosesomeinformationininconciencydataprocessing^newdefineoflowapporximationisrealizedwhichtaketheinc
6、onciencydatasetasaclasstodealwih.Totheproblemofexistingalgorithmsonlyconsiderthedependencyoftheselectedattributebutignoretheotherimportantinformation,suchasthequalityofthepotentialrule,whichisnecessarytotheapplicationofclassification.Basedonanin-depthstudyofheuristseachtactics,theattri
7、buteevaluationcriterionininformationsystemisdefinedbytwoaspects,oneisthedependencyoftheselectedattribute,theotheristherulesupport・Anewheuristfeatureselectionalgorithmbasedonrulesupportisrealizedundertheframeofroughsettheory,theexperimentalresultsshowthatthisalgorithmiseffective.Inord
此文档下载收益归作者所有