基于统计的股市多维数据关联规则发现实现

基于统计的股市多维数据关联规则发现实现

ID:37365325

大小:2.09 MB

页数:57页

时间:2019-05-22

基于统计的股市多维数据关联规则发现实现_第1页
基于统计的股市多维数据关联规则发现实现_第2页
基于统计的股市多维数据关联规则发现实现_第3页
基于统计的股市多维数据关联规则发现实现_第4页
基于统计的股市多维数据关联规则发现实现_第5页
资源描述:

《基于统计的股市多维数据关联规则发现实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、河北工业大学硕士学位论文基于统计的股市多维数据关联规则发现实现姓名:刘继昌申请学位级别:硕士专业:计算机应用技术指导教师:顾军华2003.1.1掰就工监文学磺士研究燕学位论文基于统计的般市多维数据关联规则发现研究摘要关联麓黧爨数摇莜羧关系鹃蠢效籀述方法,楚数据挖掘研究鹃重要内容.传绕熬关联娥翼q挖掘缺少挖搦的针对蛀,挖搀速度熳,挖攘结粜难予理解,挖援结鬃的数量邕大,需要避行大量的筛选以便抽取出有用规剐.另外,随蒜数掇量的急剧膨胀,数据库结构墩越来越复杂,数据表的维数越来越大。在这些溺索中有的因素怒对使用者预期的数据结构产生影响,。丽有的则与使用者的预期不搬关。本文介绍了关联规瓣挖掘韵研究情况,

2、分析了统计方法在数攥挖掘中的{搴用,提爨了一秘蕉予绞诗秘惫验绞窳瓣荚联瓣粼骚究方法。蠖臻该方法不仅霹黻有效地减少那些对结果影响不丈的交蚤因索的数量,而且还减少了本质上无意义的“非颈嫂懿结构”熬援粼熬数爨,掇亵了对大矮模数据懿挖摇效率,弗在强筑粼孛邋行了关联分析。关键词:数据挖掘,关联规则,抽样,假设检验,析城分柝,决策树,频数DISCoVERANDSTUDYSECUIUTIESASSoCIATIoNRULESINMUIjrIDIMENSIoNALDATABASEBASEoNSTATISTICSABSTRACTAssociationrulesisaneffectivemethodfordescr

3、ibingthedependencyrelationsindata,anditisoneoftheimprotantaspectsofknowledgediscovery.TaditionaIaSSOCiationruleminingmethodslackoffocusontheresults,andtheprocedureisslow.Thosealgorithmsexpresstheregularitieswithlowlevelprimitivedata,andtheminingassociationreulesaredifficulttounderstand.Furthermore,t

4、hedesirableknowledgemustbefilteredoutfromhugeresultsinapost—processingstep.Additionaly,withdataquantityexpandingrapidly,thestructureofdatabaseisbecomingmoreandmorecomplicated。Someofthesefactorsarerelatedwithclient‘sduedatastructureandothershasnothingtodowiththem。DataminingisontheinterfaceofComputerS

5、cienceandStatistics,utilizingadvancesinbothdisciplinestomakeprogressinextractinginformationfromlargedatabases.Thisarticlehighlightssomestaristicatthemesthataredirectlyrelevanttodatamining.AmethodbasedonstatisticsandprofessionalexperimentisintroducedinthispaperaimstoreducefactorswhichhardlYaffectresu

6、lt.Keywords:data—minning,association,sample,hypothesis—test,varianceanalysis,decisiontree,仔equency瓤鏊工韭太学骥毫瞬究生学茬逾文第一章绪论§I-I弓l言在信息社会中,金融方酾的数据挖掘的研究燎非常具有挑战性的.股市作为金融的一个分支几乎具有袅融领域的全部特点,煅媳型的就是这个领域由于受到来自政治、经济、军事、社会、自然等多因素的影响.致使股市波动规律的隐蔽性很强。如何从历史数据中发现股市的内在规则就显得非常舆有挑战性。美联凝爨在数据挖掇戆一个蓉要携疆究两褰。在夫多数鞍蓑豹安黢每,天锻善邃采瓣了类辍

7、予Apriod”’豹算法。这种萁法鸯一个很大静缺点,就是使用了不断产生髅逡箍并加以灏试静方式来褥列频繁黛。但是,产生候选集的代价是很大的.本文掇出利用统计的方法对_火规模数据进行预处理,以避免待分析效据过于巨大甚至难以接受的规模,同时撼高了算法的效率。我们现在已经生活在一个网络化的时代。通信、计算机和网络技术厩改变着整个人类和杜套。如果用芯片集成度来衡量微电子技术,用CPU处理速度来衡量计算机技术

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。