资源描述:
《关于月份的描述统计和方差分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、主要考虑里程数随时间变化的思路及数据分析文献综述:首先,对数据进行描述性统计,如下表:表1各个月份里程数的描述统计Statistics一月二月三月四月五月六月NValid666666Missing000000Mean2682.672450.671686.331613.171412.501657.50Median2260.002400.001588.001502.001409.501496.00Std.Deviation827.977564.052256.089338.369162.976437.660Variance685546.667318154.667
2、65581.467114493.76726561.100191545.900Range215611946949874011176Minimum210019301473127312001354Maximum425631242167226016012530Percentiles252220.001930.001521.001443.251251.751411.00502260.002400.001588.001502.001409.501496.00753284.002971.001865.501796.501589.751861.75Statistics七月
3、八月九月十月十一月十二月NValid666666Missing000000Mean1885.171527.831559.331925.171893.502697.83Median1561.001352.001350.001875.501850.002175.00Std.Deviation711.830520.317362.947246.309222.345892.312Variance506702.567270729.767131730.66760668.16749437.500796220.167Range182813978707006102157Min
4、imum139211831280160017002170Maximum322025802150230023104327Percentiles251415.251285.751332.501750.001722.502170.00501561.001352.001350.001875.501850.002175.00752420.501680.001944.502150.002018.253459.25表1和图1、2对数据进行描述。可以看出,1月、2月和12月这三个月的里程数都大于临界值。而从箱线图可以看到个月的里程数大致成U型。因此可以做出初步假设,1、2
5、、12这三个月属于旺季月份。将这三个月份记作“1”,剩余的月份记作“2”,进行方差分析,结果见表2。可以看到结果是西安、厦门是不显著的,而其他城市则较为显著。则可以认为在除西安和厦门外的其他城市,这三个月的确对里程数有影响。所以在做结论时可将这三个月份单独考虑。图1各个月份里程数的直方图图2各个月里程数的箱线图表2淡旺季和里程数之间的关系TestsofBetween-SubjectsEffectsSourceDependentVariableTypeIIISumofSquaresdfMeanSquareFSig.淡旺季北京680625.0001680625
6、.00017.592.002上海2040136.11112040136.1116.208.032西安627000.0281627000.0283.040.112厦门29013.444129013.444.100.758广州442446.6941442446.6944.935.051三亚6575805.44416575805.4449.141.013通过上表可知,对于淡旺季的分类对于大部分城市的数据还是比较显著的,即这些城市的货运量有明显的季节影响——则考虑,对淡季和旺季内的城市用同样的租车策略。首先,对于个人和公司两种方式,可以看出租车金额都关于里程数线性
7、增长。进行简单数学运算,找到两种方式的临界点时,个人方式比较好;时,公司方式比较好下面,分别将六个城市的数据合并,对淡季和旺季的货运量作分位数的Bootstrap枢轴量的95%的置信区间,来确定淡季和旺季的里程数与1700的关系,进而对租车策略进行决策。首先,对旺季(1月、11月、12月)进行百分位数区间估计。为了决策,我们要考虑这个时间段中1700以尽可能大的概率被覆盖。因此,对多个分位数进行置信区间的检验,过程如下:peak=c(2260,2960,2100,2260,4256,1921,1700,2310,1800,1900,1730,2170,31
8、70,2180,2170,4327)dull=c(1930,163