基于基本显露模式的挖掘算法

基于基本显露模式的挖掘算法

ID:34824965

大小:1.81 MB

页数:57页

时间:2019-03-11

基于基本显露模式的挖掘算法_第1页
基于基本显露模式的挖掘算法_第2页
基于基本显露模式的挖掘算法_第3页
基于基本显露模式的挖掘算法_第4页
基于基本显露模式的挖掘算法_第5页
资源描述:

《基于基本显露模式的挖掘算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、郑硕士授予单位代码!Q』』!学号或申请号!!!!!!密级学位学论文论文题目:基本显露模式的挖掘算法作者姓名:学科门类:魏芳工学专业名称:计算机软件与理论导师姓名、职称:范明教授二零零五年五月基本显露模式的诧搓算法摘要数据挖撼是扶海量豹数据中挖掘有潜凌稔僮豹售患鹣技术。分炎蹩数据挖掘中一项非常熏骚的任务,在政府组织、科学研究、商她等诸多领域鼹有广泛的应用。统计学、机器学习、神经网络等领域的研究者提出了很多分类算法,这些算法大罄透曩予,l、型数据集,慕予显露摸式(EmergingPatterns,EPs)戆分类方法是针对大型数据

2、集的分类提出的。显露模式是那些从一个数据集到另一个数据集支持魔发生显著变化的项集,它霹分类是有麓豹,这是嚣鸯它戆撬获数掇榘孛不霜类之闽戆差异。蘩一个基于EPs的分类算法怒GDong等掇出的CAEP算法,此后相继提出了JEP+Classifier、DeEPs等一系列熬于EPs的分类算法。在分必时我们发现用于分类的EPs的数量逶露缀夫,不齄选建溪畜夔EPs廷予分类。Fan穰Ramamohanarao提议镬蘑一静特殊的EPs,称作基本显露模式(essentialEmergingPatterns,简称eEPs),进行分类,并建立了熬

3、于eEP的Bayes分类法,取得了很好的分类效果。溜_l邈,魏舞麓效逮挖掘蠢eEPs是一个{夔蓬要豹闰嚣。eEPs是箨骛“最短秘”EPs,使用EPs的边界表示,eEPs恰是EPs边界表示的一组下界,因此可以使用GDong和Li提出的边界算法米挖掘所有的eEPs。然而,这种方法的效率极低。爻捡据C类上戆eEPs,必绥藏先挖据e类鞠箨c类上瓣彀模式,然麓傻用透赛算法得到c类上的eEPs。挖掘长模式是一颁很耗时的工作,并且采用边界算法产生的eEPs并不包含支持度和增长率信息。为了得到eEPs的支持度署日增长率,还鬻黉孬次{霉攒数器

4、集,绫计每个eEP斡蠢淡频率著计算增长率。本文的主票工作是提出了一种基于模式树(P.树)的eEPs挖掘新算法eEPMiner。eEPMiner采用模式增长豹策路,只嚣两次掴摇事务数据撵,就能挖掘蹬C类上所有静eEPs,著阏辩得到它们的增长率秘支持度。并虽禚挖掘过程中,模式树不仅存储数据集中所有项的信息,而且支持类的信息。我们不需要附加静室翅就可以纛接在模式褥上挖掘出所有的eEPs。在UCI机器学习数据库豹多个数据集上的实验表瞬,eEPMiner其有缀好的住髓,其速度跑蓥予边赛的算法快得多。关键譬:数据撼攒,分类,驻簇模式,基

5、本显露模式基本靛露模式避挖掘算法AbstractDataMining,iSknownasausefultechnologytofindvaluableinformationwhichispotentialinverylargedatabases.Classification,asanimportantthemeindatamining,hasbeenwidelyusedinmanyfields,suchasgovernmentorganization,scientificresearch.businesscorporatio

6、n,andSOon.Manyscholarswhoworkatstatistics,machinelearning,neuralnetwork,expertsystemsereprovideal斑ofalgorithms.Butmostofthemareonlyusedinasmalldatasize.MethodsforclassificadonbyEmergingpaRems(EPs)wereproposedinordertoclassifylargedatasets.EmergingPaRems(EPs)aleitem

7、setswhosesupportschangesignificantlyfromonedataclasstoanother.Theycanserveasagoodclassificationmodelbecausetheyrepresentknowledgewhichdiscriminatesbetweendifferentclassesofdatasets.CAEP,whichhasbeenprovidedby&DongandJ.Liin1999,isthefirstapplicationofEmergingPattern

8、stoclassification.Afterthat,aseriesofEPs—basedclassifierswereproposedsuchasJEP—classifier,andDeEPs.ButthenumberofEPsusedinclassificationalwaysisl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。