欢迎来到天天文库
浏览记录
ID:32290343
大小:1.38 MB
页数:55页
时间:2019-02-02
《03.数理统计与参数估计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、法律声明本课件包括演示文稿、示例、代码、题库、视频和声音等内容,小象学院和主讲老师拥有完全知识产权的权利;只限于善意学习者在本课程使用,不得在课程范围外向任何第三方散播。任何其他人或机构不得盗版、复制、仿造其中的创意及内容,我们保留一切通过法律手段追究违反者的权利。课程详情请咨询微信公众号:小象新浪微博:ChinaHadoop互联网新技术在线教育领航者1/55数理统计与参数估计邹博主要内容大数定律中心极限定理矩估计中心矩和原点矩最大似然估计过拟合思考:为何要取对数?EM算法互联网新技术在线教育领航者3/55
2、矩对于随机变量X,X的k阶原点矩为kEXX的k阶中心矩为kEXEX互联网新技术在线教育领航者4/55统计参数的总结期望(一阶原点矩)方差(标准差,二阶中心矩)变异系数(CoefficientofVariation)标准差与均值的比值称为变异系数,记为C·V偏度Skewness(三阶)峰度Kurtosis(四阶)互联网新技术在线教育领航者5/55偏度偏度衡量随机变量概率分布的不对称性,是相对于均值不对称程度的度量。偏度的值可以为正,可以为负或者无定义。偏度为负(负偏)/正(正偏)表示在概率密度函
3、数左侧/右侧的尾部比右侧的长,长尾在左侧/右侧。偏度为零表示数值相对均匀地分布在平均值的两侧,但不一定意味着一定是对称分布。互联网新技术在线教育领航者6/55偏度公式三阶累积量与二阶累积量的1.5次方的比率。偏度有时用Skew[X]来表示。33XEX31E23/23/2EX2X3EX33EX222EX33231E33互联网新技术在线教育领航者7/55峰度44峰度是概率密度在
4、均值处峰值高低的特征,通常定义四阶中心矩除以方差的平方减3。n14xixn44i13322421n22xixni144也被称为超值峰度(excesskurtosis)。“减3”是为了让正态分布的峰度为0。超值峰度为正,称为尖峰态(leptokurtic)超值峰度为负,称为低峰态(platykurtic)互联网新技术在线教育领航者8/55Code均值/方差偏度/峰度互联网新技术在线教育领航者9/55统计量Code互联网新技术在线教育领航者10/55数据分析0.0029
5、1.0001-0.00402.9643-0.01372.02080.00462.97480.51340.69620.78253.30522.00161.1548-0.01071.8012互联网新技术在线教育领航者11/55统计量互联网新技术在线教育领航者12/55实践中的例子互联网新技术在线教育领航者13/55思考1、给定两个随机变量X和Y,如何度量这两个随机变量的“距离”?2、设随机变量X的期望为μ,方差为σ2,对于任意正数ε,试估计概率P{
6、X-μ
7、<ε}的下限。即:随机变量的变化值落在期望值附近的概率互联网新技术在线教育
8、领航者14/55解(以连续型随机变量为例)PXfxdxXPX2Xfxdx21PXX122Xfxdx21X212Xfxdx222互联网新技术在线教育领航者15/55切比雪夫不等式设随机变量X的期望为μ,方差为σ2,对于任意正数ε,有:2PX2切比雪夫不等式说明,X的方差越小,事件{
9、X-μ
10、<ε}发生的概率越大。即:X取的值基本上集中在期望μ附近。该不等式进一步说明了方
11、差的含义该不等式可证明大数定理。互联网新技术在线教育领航者16/55大数定律设随机变量X,X…X…互相独立,并且具12n有相同的期望μ和方差σ2。作前n个随机变量n1的平均Yn,则对于任意正数Xiε,有ni1limPY1nn互联网新技术在线教育领航者17/55大数定律的意义当n很大时,随机变量X,X…X的平均值Y12nn在概率意义下无限接近期望μ。出现偏离是可能的,但这种可能性很小,当n无限大时,这种可能性的概率为0。互联网新技术在线教育领航者18/55思考题如何证明大数定理?提示:根据Y的定义,
12、求出它的期望和方差,带入切比雪夫不等式即可。互联网新技术在线教育领航者19/55重要推论一次试验中事件A发生的概率为p;重复n次独立试验中,事件A发生了n次,则p、n、An的关系满足:A对于任意正数ε,nAlimPp
此文档下载收益归作者所有