基于C45算法的空间分类应用探究

基于C45算法的空间分类应用探究

ID:45781549

大小:532.11 KB

页数:34页

时间:2019-11-17

基于C45算法的空间分类应用探究_第1页
基于C45算法的空间分类应用探究_第2页
基于C45算法的空间分类应用探究_第3页
基于C45算法的空间分类应用探究_第4页
基于C45算法的空间分类应用探究_第5页
资源描述:

《基于C45算法的空间分类应用探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、本科毕业设计(论文)题目:基于C4.5算法的空间分类应用探究学生姓名:学号:专业班级:指导教师:2014年6月20日基于C4.5算法的空间分类应用探究摘要随着大数据时代的到来,通过数据挖掘获取海量数据背后的知识变得尤为重要。而空间数据是大数据的基础使得空间数据挖掘意义更为突出。其中空间分类是空间数据挖掘近年來较活跃的一个分支。木文基于决策树算法中的C4.5算法,以94年美国部分人口收入数据为例进行了空间分类应用研究。C4.5算法采用信息增益率作为选择分支属性的标准,分类得到一组判断个人年收入是否大丁5万美金的规则用丁预测人口收入,并得到

2、不同因素对收入影响力的排序。其中工作周数、年龄、学历和性别对于收入的影响,提醒我们需要进一步促进就业,普及高等教育,消除性别歧视以及给年轻人创造更多的机会。将分类结果与空间信息相关联后直观地展示到地图上,可以看到各行业的人口收入在各地区间的一些差异,有利于进一步挖掘空间知识,指导各地区乃至国家的经济部署。关键词:空间数据挖掘;空间分类;C4.5算法;人口收入ResearchandApplicationofSpatialClassificationBasedonC4.5AlgorithmAbstractAlongwiththeBigDat

3、aera,seizingtheknowledgebehindthehugedatabydataminingisveryimportant.Accordingtotheknowledgepeoplecanforecasttheunknowninformationfromtheknowndataattributes.SpatialdataisthebasisoftheBigData.Sospatialdataminingbecomesextremelysignificant.Spatialclassificationisahotdirect

4、ionofspatialdatamining.Thethesischosethecensusincomedatain1994fromU.S.CensusBureauforclassificationbasedonC4.5algorithm.C4.5algorithmusesinformationgainratiotoselecttheattributesforclassification.Thealgorithmproducedasetofruleswhichcanjudgeandpredictifthepersonalannualin

5、comeisbeyond50,000$.Accordingtotherules,thethesisgotthedifferentdegreesoftheseattributes'influentialpoweronincome.Theinfluencesofattributeslikework-weeks,age,sexandeducationgiveusthesuggestionsthatweshouldstillpromoteemployment,education,reducesexismandcreatemoreopportun

6、itiesforyoungpeople.TheclassificationresultscanberelatedtothespatialdataandshowedontheMap.Andwecanfindthedifferencesofcensusincomefromdifferentindustriesinvariousareas.SpatialknowledgecanbefoundmoreeasilytobeusedforguidingtheplanofeconomyintheseareaseventhecountryKeyword

7、s:spatialdatamining;SpatialClassification;C4.5Algorithm;censusincome目录第]章引言11・1研究背景11.2研究意义2第2章空间数据挖掘42.1数据挖掘42.2空间数据挖掘52.2.1空间聚类52.2.2空间分类62.2.3空间关联规则72.2.4空间趋势预测7第3章决策树分类算法83.1决策树算法综述83.2C4.5分类算法原理9第4章数据预处理114.1数据来源114.2数据屈性值的选取与特殊样本的剔除114.3数据缺失值处理与字符串的数值化12第5章决策树分类结果与

8、讨论155.1决策树分类结果155.2分类结果的讨论19第6章结论25致谢27参考文献28附录29附录A按工种分类各区域人口收入分布表29附录BC4.5决策树算法流程图30第1章引言1.1研究背景随着计算机

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。