挖掘算法以及其实现

挖掘算法以及其实现

ID:34764788

大小:190.50 KB

页数:29页

时间:2019-03-10

挖掘算法以及其实现_第1页
挖掘算法以及其实现_第2页
挖掘算法以及其实现_第3页
挖掘算法以及其实现_第4页
挖掘算法以及其实现_第5页
资源描述:

《挖掘算法以及其实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、《数据挖掘》实验报告实验一分类技术及其应用实习要求:基于线性回归模型拟合一个班学生的学习成绩,建立预测模型。数据可由自己建立100个学生的学习成绩。1)算法思想:最小二乘法设经验方程是y=F(x),方程中含有一些待定系数an,给出真实值{(xi,yi)

2、i=1,2,...n},将这些x,y值代入方程然后作差,可以描述误差:yi-F(xi),为了考虑整体的误差,可以取平方和,之所以要平方是考虑到误差可正可负直接相加可以相互抵消,所以记误差为:矚慫润厲钐瘗睞枥庑赖。e=∑(yi-F(xi))^2它是一个多元函数,有an

3、共n个未知量,现在要求的是最小值。所以必然满足对各变量的偏导等于0,于是得到n个方程:聞創沟燴鐺險爱氇谴净。de/da1=0de/da2=0...de/dan=0n个方程确定n个未知量为常量是理论上可以解出来的。用这种误差分析的方法进行回归方程的方法就是最小二乘法。残骛楼諍锩瀨濟溆塹籟。线性回归如果经验方程是线性的,形如y=ax+b,就是线性回归。按上面的分析,误差函数为:e=∑(yi-axi-b)^2各偏导为:de/da=2∑(yi-axi-b)xi=0de/db=-2∑(yi-axi-b)=0于是得到关于a,b

4、的线性方程组:(∑xi^2)a+(∑xi)b=∑yixi(∑xi)a+nb=∑yi设A=∑xi^2,B=∑xi,C=∑yixi,D=∑yi,则方程化为:Aa+Bb=CBa+nb=D29《数据挖掘》实验报告解出a,b得:a=(Cn-BD)/(An-BB)b=(AD-CB)/(An-BB)1)编程实现算法C++程序:#include#includeusingnamespacestd;voidmain(){doublex,y,A=0.0,B=0.0,C=0.0,D=0.0,delta,

5、a,b;intn,sno,avgstudy;cout<<"请拟合输入样本数目"<>n;for(inti=0;i>sno;cout<<"请输入学生上自习时间,按照每天小时计算"<>x;cout<<"请输入学生请输入平均成绩"<>y;A+=x*x;B+=x;C+=x*y;D+=y;}delta=A*n-B*B;a=((C*n-B*D)/delta);b=((A*D-C*B

6、)/delta);cout<<"a="<>avgstudy;cout<

7、果输入是将各个同学的上自习的时间按照小时计算比如(4,85)(5,94),将成绩和上自习时间进行相应的线性回归,推导出相应的线型方程,以便今后对其他学生上自习以及成绩的估测。29《数据挖掘》实验报告实习二聚类技术及其应用实习题1编程验证单连接凝聚聚类算法,实验数据可使用第五章表5.2的数据进行。要求输出层次聚类过程中每一步的聚类结果。酽锕极額閉镇桧猪訣锥。实习题2利用K-均值聚类算法对如下数据进行聚类,其中输入K=3,数据集为{2,4,10,12,3,20,30,11,25,23,34,22}。要求输出每个类及其中

8、的元素。1)算法基本思想的描述Givenk,thek-meansalgorithmisimplementedinfoursteps:彈贸摄尔霁毙攬砖卤庑。–Partitionobjectsintoknonemptysubsets–Computeseedpointsasthecentroidsoftheclustersofthecurrentpartition(thecentroidisthecenter,i.e.,meanpoint,ofthecluster)謀荞抟箧飆鐸怼类蒋薔。–Assigneachobject

9、totheclusterwiththenearestseedpoint厦礴恳蹒骈時盡继價骚。–GobacktoStep2,stopwhennomorenewassignment茕桢广鳓鯡选块网羈泪。2)编程实现算法//***********引入库函数#include"iostream.h"#include"math.h"#include"stdlib.h"#

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。