数据建模与分析:线性回归小论文

数据建模与分析:线性回归小论文

ID:42822929

大小:1.78 MB

页数:20页

时间:2019-09-22

数据建模与分析:线性回归小论文_第1页
数据建模与分析:线性回归小论文_第2页
数据建模与分析:线性回归小论文_第3页
数据建模与分析:线性回归小论文_第4页
数据建模与分析:线性回归小论文_第5页
资源描述:

《数据建模与分析:线性回归小论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、上海住房面积和房价的线性回归分析王明黔(上海人学机电工稈与自动化学院,上海200444)摘要:在数据构建统计模型的学习屮,统计学习是其一种基础的学习方法。本文针对城市人口数目与饮品连锁店利润的关系,就已冇的数据进行线性回归分析,利用MatlabX具进行数据的线性回归模拟,进而得出城市人口数目与饮品连锁店利润的散点图、拟合宜线图和三维等高线图。为了分析上海地区的住房血积和房价的关系,收集最近的角房成交数据,将数据导入到Matlab进行分析,得出上海房价与住房面积的线性关系。关键词:Matlab:线性冋归;目标函数;梯度下降;统计学习基于数据的机器学习是现代智能技术中十分重要的一个方面

2、,主要研究如何从一些观测数据(样本)出发,得出日前尚不能通过原理性分析得到的规律,并用以对未来数据或无法观测的数据进行预测。现实生活中大量存在我们尚无法准确认识但却可以进行观测的事件。因此,这种机器学习在从现代科学、技术到社会、经济等各领域中都有着十分重要的应用⑴。使用线性回归方法可以对一些观测数据进行分析,把预测事件屮一些因素作为自变量,另一些随自变量变化而变化的变量作为因变量,研究它们Z间的非确定性因果关系,以便预测因变量的未来发展趋势。根据若干观测数据寻找描述变量Z间的函数或统计相关关系的最佳数学表达式,或者匹配数据之间相关关系的最佳拟合曲线,来表达随机性变量间的规律⑵。利用

3、线性冋归通过多变量机器学习的方法,可以建立上海住房面积和价格的线性关系,建立数学模型并评估其中的未知参数。1案例分析1.1目标函数的建立根据已知给出的城市人口数目与饮品连锁店利润的一些数据,可以得到一个样本集,如图1,为样本在Matlab软件加载数据图,第一列表示城市人口数目,第二列表示饮品连锁店利润。编辑器-C:UsersAdministratorDesktop

4、5^^1$-

5、—1ex1datal.txtex1.mcomputeCost.m16.1101,17.59225・5277,9.130238.5186,13.66247.0032,11.85455.8598,6.8

6、23368.3829,11.886—7.4764,4.348388.5781,1296.4862,6.5987105.0546,3.8166图1城市人口数目与饮品连锁店利润的样本集Fig1Urbanpopulationandbeveragechainprofitsofsampleset针对样本集,我们可以假设一个线性模型:(1)福(X)=%+&“式中:饥(X)一一假设的线性模型;X样本/特征;&0、q——参数。其中,q为模型参数,因此问题就可以转换为,求出&°和q的值。为了得到较为准确的回归线,应该满足一个前提,即各样本点尽可能分布在所建立的线性模型周围,因此我们建立目标函数:1m

7、丿禺,仇)=亍工(珞(卅)-产F⑵式中:x⑴向量兀中的第i个元素;y(i)向量y中的第八个元素;為(兀)一一模型假设;m——训练集的数量。因此,我们只耍求得使上述函数的值最小时的&。和q的值。1.2目标函数的求解我们首先从一组仇和q开始,利用最速下降法不断改变%和q的值来减小J(仇,q),直到达到我们希望得到的最小值〔叭对于最速下降法,可利用以下公式而来求解:3y:=0-a—J(仇,即⑶JJ3^01式中:a——学习速率(步长);二■丿禺G)—下降方向。j其中01为修正学习速率,即搜索的步长,当a过小,会延长搜索的时间,当a过大,可能会错过极值点,导致不收敛。还有要注意最速下降法会收

8、敛到局部最小值的情况,这种情况即便修正学习速率也不会改变结果,并且接近局部最小值时,因为斜率的减小最速下降法会自动减少每步的补偿⑷。因此,我们要现注意目标函数的极小值情况,如果有局部最小值可通过调节a参数的大小来跳过局部最小值情况,否则,就不需跳过,最终通过多次迭代可以得到最终的理想结果。2Matlab求解2.1最速下降法的循环语句在Matlab程序中,最速下降法是一个不断迭代循环的过程,且&。和G确保同时更新,具体循坏如下:tempO:=仇(给即tempi(仇,&():=tempO&i:=templ2.2ComputeCost函数的定义J函数即目标函数,m代表数据的个数,具体程序

9、如下:functionJ=computcCost(X,y,theta)m=length(y);J=0;predictions=X*theta;J=l/(2*m)*(predictions-y)f*(predictions-y);end2.3gradientDescent函数的定义GradientDescent函数就是最速下降法的迭代与循环过程呵,具体如下:function[theta,Jhistory]=gradientDescent(X,y,theta,alpha,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。