某牛人的统计笔记

某牛人的统计笔记

ID:1837662

大小:622.00 KB

页数:19页

时间:2017-11-13

某牛人的统计笔记_第1页
某牛人的统计笔记_第2页
某牛人的统计笔记_第3页
某牛人的统计笔记_第4页
某牛人的统计笔记_第5页
资源描述:

《某牛人的统计笔记》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第I部分描述统计描述一列变量四种量表命名量表→顺序量表→等距量表→等比量表用表表述整个分布会整理数据集表述。次数分布表、会用累计次数分布表l建构这些区间有一系列的“惯常法则”(rulesofthumbs)i.分组次数分布表应该有大约10个区间,目的是使这组数据易于直观感受和理解ii.每个区间开始的分数应该是组距的倍数iii.所有区间的宽度应该相等l编制分组次数分布表的步骤i.求全距ii.定组数iii.定组距iv.写出区间上下限统计每个区间的次数用图表述整个分布等距量表/等比量表:直方图、直线图。(注意横坐标)命名量表/顺序量表:棒图、饼图。(注意横坐标)集

2、中趋势和离中趋势集中趋势离中趋势等距量表/等比量表均值---正态分布且无极端值方差、标准差中数---偏态、有极端值IQR、Range=最大-最小+1命名量表众数顺序量表众数l方差、标准差公式:总体方差、样本方差;其中总体标准差、样本标准差lTiedmedian的计算:求11、11、11、11、13、13、13、15、17、17的中数。xff%%172100151801337011440先排序,用中间数所在分数的精确上下限。用差值法求中数,在累计次数分布表中,它所在的区间的精确上下限为12.5、13.5,所以有结果12.8。l四分位差与四分位距:SIQR=I

3、QR/2四分位距IQR=75%的位数-25%的位数。l若用Z分数差表求19lTV变异分数:,TV用于比较样本之间的离散程度,它大表示离散度大,小,表示离散度小。l均值、中数、众数在偏态分布中的位置描述整体分布中的个别分数相对于均值的位置:Z分数Z=(X-μ)/σ。注意它的各种变化:相对于其它值的位置:百分位等级,注意区分:百分位数、百分位等级描述两列变量两列至少顺序的量表没有二分变量两个为等距/等比Pearson积差相关,至少顺序Spearman等级相关,有一个二分变量点二列相关*,p为二分变量中一个类目的比例,q为另一个类目的比例,为p对应的那些数据的均

4、值,为q对应的均值。为全部数据的标准差。全部数据的标准差有两个二分变量Phi系数也是命名量表?*注意与t检验的关系。两列命名量表相关用独立性检验。df=N-1,fe=np描述多列变量顺序型19用肯德尔系数:W取值[0,1]K位列数/评价这的数目,N为评价对象的数目,R每一个被评价事物的K个等级之和。有相同等级的部要求。命名型用独立性检验第II部分几个检验统计分布Z分布标准分数M=0,SD=1.所有的正态分布都可以转换为z分数,它与均值间的面积代表概率。34.13%的分数落入均值与一个标准差之间.13.59%的分数落入第一个标准差与第二个标准差之间。2.28

5、%的分数会落入第二个标准差与第三个标准差之间。几个重要的临界值:Z0.05/2=1.96,Z0.01/2=2.58,Z0.001/2=3.29Z0.05/1=1.65,Z0.01/1=2.33,Z0.001/1=3.0995%会落在之间,99%会落在之间。95%会落在1.65之左,99%会落在2.58之左。t分布(总体未知)当自由度很大时(),t分布于z分布的差异变得很小。注意z、t、F临界值之间的关系:、特别是,要注意它的变化。二项分布离散的分布,而z、t、F为连续的分布。当样本容量N足够大使接近正态分布,可近似地用正态分布计算,但要考虑精确上下限。且要

6、满足:。应用举例1.求某事件发生的概率。,其中,x为某事件发生的次数,n为总数,p未发生的概率,q尾部发生的概率。2.求对某事件发生推断是不是猜测时,a.先确定猜测水平,一般认为95%正确时不是猜测所致。注意题目要求。b.当时,zcrit=1.645。由计算,x取整数。样本均值分布样本均值分布,当其中每一个的样本容量(n>30)时,无论原先的分布式不是正态,依据中心极限定理,样本均值分布都是正态分布。而且其标准差称为标准误。19样本已知:样本未知样本分布的标准差就是它的标准误!中心极限定理1.形状是正态分布2.3.F分布注意自由度df,如何查表:=?。在假

7、设检验中,常用的是单侧检验,第III部分假设检验相关概念I类错误:表示错误地拒绝H0所犯的错误。既不存在差异却认为有差异。II类错误:表示错误地接受所犯的错误,既有差异却认为不存在差异。统计效力:1-表示正确拒绝错误的虚无假设H0的概率。所以效力越高,侦察到的处理效应的能力越高。影响效力的几个因素:1.增加水平会增加效力.2.单尾考验比双尾考验的效力高,如果能够设定正确的尾端。3.增加样本容量会减少标准误,从而增加效力。A.两个总体间差异大,注意阴影区域很大,正确地拒绝虚无假设的机会很大。B.两个总体间差异小,注意阴影区域很小,正确地拒绝虚无假设的机会不大

8、。总体已知参数检验均值的参数检验I均值的显著性检验总体已知、=?、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。