基于兴趣度的判定树算法快速分类的优化

基于兴趣度的判定树算法快速分类的优化

ID:36501224

大小:1.05 MB

页数:46页

时间:2019-05-11

基于兴趣度的判定树算法快速分类的优化_第1页
基于兴趣度的判定树算法快速分类的优化_第2页
基于兴趣度的判定树算法快速分类的优化_第3页
基于兴趣度的判定树算法快速分类的优化_第4页
基于兴趣度的判定树算法快速分类的优化_第5页
资源描述:

《基于兴趣度的判定树算法快速分类的优化》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电子科技大学硕士学位论文基于兴趣度的判定树算法快速分类的优化姓名:王睿申请学位级别:硕士专业:应用数学指导教师:钟守铭;杨晋浩20060525摘要数据挖掘在科研和商业应用中正发挥着越来越重要的作用。随着数据量的增加,数据挖掘工具处理海量数据的能力问题显得日益突出。数据挖掘通常又称数据库知识发现。为了系统的将数据挖掘技术应用与企业的决策,将企业的数据资源转换为企业的核心竞争力,一个有效的方法就是将数据挖掘技术与企业知识库技术有机地结合起来,形成分析研究和应用需求相互促进、知识与规则提取方法的专业化的应用体系。数据挖掘的基本任务是从海量数据中获取隐含在数据背后的有用的

2、知识。数据挖掘应用基本过程是集成历史数据,在此基础上建立挖掘模型,挖掘出有价值的商业运作规律和模式,再将这些挖掘模型、规律和模式表示成易理解的规则集成到企业知识库中,最后是将知识库知识应用于企业的商业活动。不同的数据挖掘任务会产生出不同类型的知识。通过对这些知识类型结构和性质的研究,可以得到相应的数据挖掘过程需要完成的任务集合,从而定义出规范的、完整的数据挖掘算法流程。决策树学习有很多算法,本文着重研究了对引入用户兴趣度参数的ID3算法在面对多值属性时的快速分类的优化,在避免了多值弱相关属性覆盖少值强相关属性的基础上,通过数学工具简化原算法的复杂度和编码代价,从而

3、提高使用该算法时的运算速度,尽量多的节约计算时间,从而达到降低成本的,提高效率的目的。关键词:决策树,归纳学习,ID3算法,机器学习ABSnUCTABSTRACTThedatamillingplayan血portantr01einscicntificresearchaIldbusinessapplication.Witllt11eincreaseofdataqu趾tity’111eproblemofabili哆todealwimmcdataofins慨entwllichusedfordataminingseemsoutstandingdaybydayThedata

4、miIlingandusuallyhavea110mernamecalledmeknowledgeofmed北masetofind.Forsyst锄aticminjngmedecisionoftechnical印plication趾de玎止erpriseoftlledata,changet11edataresourcesofcnterprisesintothekeycompctitivenessofenterprises,alle丘bctiVemethodistocombinem访iIlgtechnoIogyandenterprise’sknowledgebase

5、technologytogetllero唱aIlically,fonnasystemwhichincludereseafchofanalWeanddemalldofapplicationpromotemunJally,memethodtodrawingthemleaⅡdknowledgepmfessionally_It曲pIies也eusemlknowledgebehinddalathatmedataminillgisobtained丘omthedata.Thedataminjngusedtointe铲atethe1listoricaldata,setupmemo

6、delofminingonmisbasis,miningoutvaluablebusmessn11eaIldmode.Thenshowsthernintoa11intelli百blemle,alldinte铲atedin铷terprise’sknowledgebase.The1asttaskisapplymeknowledgebaseinmebusinessacti“tyofenterprises.willproducedi疏rentkindofknowIcdgeindi饪矗entdataIIliningtaskT1lrou曲Ⅱleresearchons咖ctll

7、reandnamreof也eseknowledge,cangetmecorrespondinginfomaIioninomertaskofdatamiIlingwhichhaves锄emle.Thusdefinet11enominthepmcedllreofalgorithmsofdataminin晷。111edecisiontreehada10tofalgori恤ns,thispapcrfocusont11eop廿mizationof缸tdassi丘cationinthef犯eofn-ValueanrfbuteofID3algorithmwhichhadpara

8、meter

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。