资源描述:
《数学建模统计模型.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、建立实际回归模型的过程实际问题设置指标变量解释变量的重要性;不相关性;用相近的变量代替或几个指标复合;个数适当——这个过程需反复试算收集整理数据时间序列数据:随机误差项的序列相关,如人们的消费习惯横截面数据:随机误差项的异方差性,如居民收入与消费样本容量的个数应比解释变量个数多缺失值,异常值处理构造理论模型绘制yi与xi的样本散点图,如生产函数、投资函数、需求函数估计模型参数——最小二乘,偏最小二乘,主成分回归等,依靠软件.模型检验——统计检验和模型经济意义检验,从设置指标变量修改模型运用经济因素分析
2、、经济变量控制、经济决策预测1线性回归实例选讲--牙膏的销售量1.问题建立牙膏销售量与价格、广告投入之间的模型;预测在不同价格和广告费用下的牙膏销售量.收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其他厂家同类牙膏的平均售价.9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851销售量(百万支)价格差(元)广告费用(百万元)其他厂家价格(元)本公司价格(元)
3、销售周期2明确问题一牙膏的销售量确定关系:牙膏销售量——价格、广告投入内部规律复杂数据统计分析常用模型回归模型×数学原理软件30个销售周期数据:销售量、价格、广告费用、同类产品均价销售周期公司价(元)它厂价(元)广告(百万元)价差(元)销售量(百万支)13.853.805.50-0.057.3823.754.006.750.258.51………………293.803.855.800.057.93303.704.256.800.559.2632.基本模型x2yx1yy~公司牙膏销售量x1~其
4、它厂家与本公司价格差x2~公司广告费用解释变量(回归变量,自变量)被解释变量(因变量)多元回归模型4Matlab统计分析rcoplot(r,rint)残差及其置信区间作图MATLAB7.0版本s增加一个统计量:剩余方差s2[b,bint,r,rint,stats]=regress(y,X,alpha)statisticstoolbox解释变量:矩阵显著性水平:0.05系数估计值置信区间残差向量y-xb置信区间被解释变量:列检验统计量:R2,F,p随机误差:正态分布均值为零回归系数x=3.模型求解由数
5、据y,x1,x2估计x=[ones(size(x1)),x1,x2,x2.^2];[b,bint,r,rint,stats]=regress(y,x)程序54.结果分析参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p<0.0001s2=0.04900123,故x22项显著但可将x2保留在模型中即:y的90.54%可
6、由模型确定、F远超过F检验的临界值、p远小于=0.05显著性:整体显著x2:2置信区间包含零点,但右端点距零点很近——x2对因变量y的影响不太显著;3显著6控制价格差x1=0.2元,投入广告费x2=6.5百万元销售量预测区间为[7.8230,8.7636](置信度95%)上限用作库存管理的目标值下限用来把握公司的现金流若估计x3=3.9,设定x4=3.7(百万支)销售量预测价差x1=它厂价x3-公司价x4估计x3,调整x4控制x1预测y得则可以95%的把握知道销售额在7.83203.729(
7、百万元)以上75.模型改进x1和x2对y的影响独立参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p<0.0001s2=0.04260123参数参数估计值置信区间29.1133[13.701344.5252]11.1342[1.977820.2906]-7.6080[-12.6932-2.5228]0.6712[0.2
8、5381.0887]-1.4777[-2.8518-0.1037]R2=0.9209F=72.7771p<0.0001s2=0.049030124x1和x2对y的影响有交互作用比较:置信区间,R28比较:两模型销售量预测控制价格差x1=0.2元,投入广告费x2=6.5百万元(百万支)区间[7.8230,8.7636]区间[7.8953,8.7592](百万支)预测区间长度更短略有增加9x2=6.5x1=0.2x1x1x2x26.比较:两模型与x