数据挖掘实验报告

数据挖掘实验报告

ID:34001453

大小:264.00 KB

页数:12页

时间:2019-03-03

数据挖掘实验报告_第1页
数据挖掘实验报告_第2页
数据挖掘实验报告_第3页
数据挖掘实验报告_第4页
数据挖掘实验报告_第5页
资源描述:

《数据挖掘实验报告》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、智能信息处理课程实验汪辉13一、实验工具Weka简介Weka是由新西兰怀卡托大学开发的智能分析系统(WaikatoEnvironmentforKnowledgeAnalysis)。在怀卡托大学以外的地方,Weka通常按谐音念成Mecca,是一种现今仅存活于新西兰岛的,健壮的棕色鸟,非常害羞,好奇心很强,但不会飞。Weka是用Java写成的,它可以运行于几乎所有的操作平台,包括Linux,Windows等操作系统。Weka平台提供一个统一界面,汇集了当今最经典的机器学习算法及数据预处理工具。做为知识获取的完整系统,包括了数据输入、预处理、知识获取、模式评估等

2、环节,以及对数据及学习结果的可视化操作。并且可以通过对不同的学习方法所得出的结果进行比较,找出解决当前问题的最佳算法。2005年8月,在第11届ACMSIGKDD国际会议上,怀卡托大学的Weka小组荣获了数据挖掘和知识探索领域的最高服务奖,Weka系统得到了广泛的认可,被誉为数据挖掘和机器学习历史上的里程碑,是现今最完备的数据挖掘工具之一(已有11年的发展历史)。Weka的每月下载次数已超过万次。二、Weka的使用方法1、是将一种学习方法应用于一个数据集,然后分析其输出,从而更多地了解这些数据(分析数据集的潜在知识)。2、是使用已学习到的模型对新的实例做出

3、分类预测3、是应用几种不同的学习器,再根据它们的性能表现选择其中一种用来做预测。在Weka中将学习方法又称作分类器或学习器,用户可在Weka互动式界面的菜单中选择一种想要的分类器。许多分类器带有可调节的参数,这些参数可通过属性列表或对象编辑器进行更改。所有学习器的性能都是通过一个共同的评估模块进行衡量。与选择学习器一样,用户也要从菜单中选择能满足或对应该学习器的过滤器(进行数据预处理)。不同的过滤器具有不同的参数。其所处理的数据是一个二维表。三、实验步骤1、流量数据输入到weka平台;2、FCBF或者其它有监督特征选择算法进行特征选择3、naive bay

4、es(朴素贝叶斯)分类四、实验内容1、无特征选择+贝叶斯;2、特征选择+贝叶斯;3、无特征选择+核密度估计贝叶斯;4、有特征选择+核密度估计贝叶斯;五、实验代码1、无特征选择+贝叶斯;*Rule:LOCALdominatesNONE;GLOBALdominatesLOCAL.*->Whenthereisalocalcredalset,computewiththe*localcredalset.*->Whenthereisaglobalcredalsetspecification,*computewiththat(ignorelocalcredalsets)

5、.*/publicclassQBExpectationextendsExpectation{ectation(BayesNetb_n,booleandpc){super(b_n,dpc);}protectedvoidinitialize_inference(){inference=newQBInference(bn,do_produce_clusters);}protectedvoiddo_expectation_from_inference(DiscreteFunctiondf){current_function=df;if(((QBInference)

6、inference).is_inference_without_local_neighborhoods)expectation_without_local_neighborhoods(df);elseexpectation_with_local_neighborhoods(df);}privatevoidexpectation_with_local_neighborhoods(DiscreteFunctiondf){inti,j,jump=1;doublev,min,max;for(i=1;i

7、bles();i++)jump*=normalized_results.get_variable(i).number_values();min=df.get_value(0);max=df.get_value(0);for(i=0;idf.get_value(i))max=df.get_value(i);}for(j=0;j

8、ts.get_variable(0).number_values(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。