数据挖掘实验报告二.doc

数据挖掘实验报告二.doc

ID:53117130

大小:2.21 MB

页数:5页

时间:2020-04-01

数据挖掘实验报告二.doc_第1页
数据挖掘实验报告二.doc_第2页
数据挖掘实验报告二.doc_第3页
数据挖掘实验报告二.doc_第4页
数据挖掘实验报告二.doc_第5页
资源描述:

《数据挖掘实验报告二.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、实验二一、基本原理分类算法是解决分类问题的方法,是数据挖掘、机器学习和模式识别中一个重要的研究领域。分类算法通过对已知类别训练集的分析,从中发现分类规则,以此预测新数据的类别。分类算法的应用非常广泛,银行中风险评估、客户类别分类、文本检索和搜索引擎分类、安全领域中的入侵检测以及软件项目中的应用等。二、实验目的:掌握CART决策树构建分类模型。三、实验内容对所有窃漏电用户及真诚用户的电量、告警及线损数据和该用户在当天是否窃漏电的标识,按窃漏电评价指标进行处理并选取其中291个样本数据,得到专家样本,使用CART决策树实现分类预测模型

2、。注意:数据的80%作为训练样本,剩下的20%作为测试样本。四、实验步骤1、对数据进行预处理2、把数据随机分为两部分,一部分用于训练,一部分用于测试。分成testData和trainData文件即测试数据和训练数据数据的80%作为训练样本,剩下的20%作为测试样本。1、使用tree包里的tree函数以及训练数据构建CART决策树模型,使用predict函数和构建的CART决策树模型分别对训练数据和测试数据进行分类。1、使用nnet包里面的nnet函数以及训练数据构建神经网络模型,使用predict函数和构建的神经网络模型分别对训练

3、数据和测试数据进行分类。1、对比分析CART决策树和神经网络模型对数据处理的结果。一、实验结果二、思考与分析尝试采用神经网络对数据进行分类,并与CART决策树的结果进行比较。答:与神经网络相比,决策树可以很好地处理非数值型的数据,但是决策树对连续的数据(比如连续的数值型数据)不太擅长。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。