欢迎来到天天文库
浏览记录
ID:61772523
大小:506.00 KB
页数:40页
时间:2020-02-06
《第3章 数据的采集与统计分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第3章数据的采集与统计分析主要内容3.1数据的采集3.2分布的识别3.3参数估计3.4拟合度检验3.5随机变量的生成输入数据是模拟实验的动力系统名称典型的输入数据排队系统顾客到达的间隔时间顾客被服务时间的分布库存系统需求顾客的分布顾客需求量的分布物料订货的提前期分布生产系统作业到达的间隔时间作业类型的概率每种作业每道工序服务时间的分布可靠性系统生产无故障作业时间系统的模拟依靠这些原型系统的运行数据,缺乏这些数据的实验和实验值的提取,模拟也就毫无意义。引言收集原始数据基本统计分布的辨识参数估计拟合度检验可信否?否是是输入数据分析的基础,需要
2、分析的经验,对收集的方法、数据需要做预先的设计和估算。因此这是一个关键的、细致的工作。通过统计的数学手段(计数统计、频率分析、直方图制作等),得出统计分布的假设函数(如:正态分布、负指数分布、Erlang分布等)根据统计特征,计算确定系统的假设分布参数。运用统计分布的检验方法,对假设的分布函数进行可信度检验。通常采用的是2检验。输入数据模型确定的基本方法正确输入数据引言常用随机分布离散两点分布二项式分布泊松分布产品合格/不合格批量产品中合格品数量与次品的数量单位时间内道路上通过的车辆数、顾客到达数、交换机单位时间内呼叫数引言常用随机分布
3、连续均匀分布指数分布正态分布韦伯分布可用于随机变量的生成电话系统中用户的通话时间;机器设备发生故障的时间间隔测量误差;某个地区劳动者的收入零部件或设备的寿命;完成某项任务所需要的时间引言3.1数据的采集数据采集是针对实际问题,经过系统分析或经验的总结,以系统的特征为目标,收集与此有关的资料、数据、信息等反映特征的相关数据。数据的采集是一项工作量很大的工作,也是在模拟中最重要、最困难的问题。即使一个模型结构是正确的,但若收集的输入数据数据不正确,或数据分析不对,或这些数据不能代表实际情况,那么利用这样的数据作为决策的依据必将导致错误,造成损
4、失和浪费。数据采集工作应该具有科学的态度、忠于现实的工作作风。应该将数据收集工作、模拟工作的意义让参与者明确,得到参与者的支持和理解。什么是数据采集?数据采集的意义?数据采集的基本态度?做好模拟计划,详细规划模拟所需要收集的数据确定应该收集些什么样的数据、何时进行采集以及以什么样的方式进行采集。数据采集的类型应该尽量广泛,而不应该仅仅局限于实际建模时要用到的数据类型。例如,在采集工人使用机床加工零件的时间时,如果除了采集工人加工一个零件所使用的时间外,同时再采集一些诸如工人的性别、年龄、身体状况等辅助数据,这样在以后的数据分析中如发现某些
5、数据与其它数据有明显差异,就可利用辅助数据,判别数据是否具有合理性与代表性,或者指导我们对所采集数据进行合理的修正。数据采集的时间应有一定的跨度,以免所采集的样本数据带有某种片面性。为了对某个交通道口的堵车情况进行模拟,采集车流数据的时间不能只是在一天中的某一段时间,如早晨,也不能只是在一个星期中的某一天3.1数据的采集-技巧3.1数据的采集-过程监控由于数据的采集工作可能并不是进行一次就能完成的,而是可能历时几天、几个星期甚至几个月。一般讲,系统在不同时间所处的环境不同,而在不同环境下采集的数据会有一定的统计差异性。我们要知道在数据采集
6、过程中,所采集的数据是否具有统计上的一致性,或者说在采集过程中系统的特征是否发生了变化。可以运用控制图对数据的采集过程进行监控。主要对数据样本的均值与极差进行监控先确定一个数据采集的初始阶段,在这阶段中采集到的数据用于建立控制图,为以后的采集过程的监控提供依据。假设在初始阶段我们已采集到了N个数据,将这N个数据按采集的顺序分成k批,每批n(一般取n=5或6为好)个数据。记第i批第j个数据为xij,则我们可以计算出每批的均值极差3.1数据的采集-过程监控3.1数据的采集-过程监控批均值的平均值和极差的平均值的控制限为R的控制限为3.2分布的
7、识别-数据特征分析数据特征分析的目的是帮助我们用一些简单的统计特征指标来描述大样本数据,从而揭示样本数据的一些基本特征。样本均值、中位数、方差、偏差系数、莱克塞斯比率、偏斜系数3.2分布的识别-直方图直方图构筑方法取值区间划分水平区坐间标标轴注的计区算间确内定的每发一生数垂直标坐注标频轴数上绘上制的各发个生区频间数绘制直方图对于离散系统的统计分析中,一般用频率统计的分析方法来计算分布函数。其图形描述用的就是直方图。分组区间的组数依赖于观察次数以及数据的分散或散布的程度。一般分组区间组数近似等于样本量的平方根。即:如果区间太宽(m太小),则
8、直方图太粗或呈短粗状,这样,它的形状不能良好地显示出来。如果区间太窄,则直方图显得凹凸不平不好平滑合适的区间选择(m值)是直方图制作,分布函数分析的基础。3.2分布的识别-直方图分组区间数量的
此文档下载收益归作者所有