欢迎来到天天文库
浏览记录
ID:11707108
大小:4.15 MB
页数:77页
时间:2018-07-13
《王静龙非参数统计分析1 8章教案》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.50.1),随即抽取n=100件零件,数据如下:表1.18.5038.5088.4988.3478.4948.5008.4988.5008.5028.5018.4918.5048.5028.5038.5018.5058.4928.4978.1508.4968.5018.4898.5068.4978.5058.5018.5
2、008.4998.4908.4938.5018.4978.5018.4988.5038.5058.5108.4998.4898.4968.5008.5038.4978.5048.5038.5068.4978.5078.3468.3108.4898.4998.4928.4978.5068.5028.5058.4898.5038.4928.5018.4998.8048.5058.5048.4998.5068.4998.4938.4948.4908.5058.5118.5028.5058.5038.7828.5028.5098.4998.4988.4938.8978.5048.4938.
3、4947.7808.5098.4998.5038.4948.5118.5018.4978.4938.5018.4958.4618.5048.691经计算,平均长度为,非常接近中心位置8.5cm,样本标准差为cm.一般产品的质量服从正态分布,。这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂商,而用非参数分析却是另外一个结果。以下是100个零件长度的分布表:长度(cm)频率(%)~8.4058.40~8.4608.46~8.4818.48~8.50458.50~8.52458.52~8.6008.60~4合计100这说明有90%的零件长度在cm之间,有9%的零件不合格
4、,所以工厂不需要换供应商。例2哪一个企业职工的工资高?表1.3两个企业职工的工资企业1111213141516171819204060企业23456789103050显然,企业1职工的工资高,倘若假设企业1与企业2的职工工资分别服从正态分布,则这两个企业职工的工资比较问题就可以转化为一个参数的假设检验问题,原假设为,备择假设为则若为真,则其中拒绝域为:检测值为:故不能拒绝原假设,认为两企业的工资水平无差异。也可以用检验由于故不能拒绝原假设,认为两企业的工资水平无差异。这里我们采用的显著性水平为0.1.但这个统计结论与实际数据不相符合。主要是因为假设工资服从正态分布,这个假设是错误的
5、,用错误的假设结合参数分析自然得出的结论不可靠。这时候有两种方法处理,一种更换其他分布的假设,二是用非参数数据的方法的分析。非参数统计如同光谱抗生素,应用范围十分广泛。参数统计与非参数统计针对不同的情况提出的统计方法,它们各有优缺点,互为补充。第二章描述性统计§2.1表格法和图形法表格法主要有列频数分布表和频率分布表例2.1某公司测试新灯丝的寿命,列表如下:107736897767994599857738154657180847998636566798668746182659863716211664797879778689767485738068788972589278887710
6、38863688881647375906289717470856165617562947185848363926881(1)找到最小值43,最大值116;(2)将组数分为5~20组,,分16组,组距为5表2.2灯丝寿命的频率分布表灯丝寿命(小时)个数频率(%)40--4410.545--4910.550--5421.055--5984.060--642412.065--692814.070--743015.075--793417.080--842311.585--892211.090--94147.095--9984.0100--10431.5105--10910.5110--11
7、400.0115--11910.5总和200100对应的直方图为:§2.2表格法和图形法数值方法主要是用数值来表示数据的中心位置(或者平均大小)和离散程度等。135331323244列1平均2.833333标准误差0.34451中位数3众数3标准差1.193416方差1.424242峰度-0.20317偏度-0.00713区域4最小值1最大值5求和34观测数12它的平均数,中位数,众数差不多大。但大部分情况不是这样的,例如:§表2.3某保险公司赔款样本数据频率分布表赔
此文档下载收益归作者所有