单变量的统计描述.ppt

单变量的统计描述.ppt

ID:52635197

大小:185.50 KB

页数:22页

时间:2020-04-12

单变量的统计描述.ppt_第1页
单变量的统计描述.ppt_第2页
单变量的统计描述.ppt_第3页
单变量的统计描述.ppt_第4页
单变量的统计描述.ppt_第5页
资源描述:

《单变量的统计描述.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、一、变量的层次1、定类变量定类变量是变量层次最低的,它的取值只有类别属性之分,而无大小程度之分.如民族,婚姻等.2、定序变量定序变量的层次高于定类变量.它的取值除了有类别属性之外,还有等级次序的差别.常见的如受教育程度,满意度,社会经济地位等.3、定距变量定距变量的层次又高于定序变量.定距变量的取值,除了具有次序属性外,取值之间的距离可以度量.如家庭住房面积,家庭人口数等.4、定比变量定比变量是将两类相关的数加以对比,形成的相对数,用以反映现象的构成、比重、密度和速度等数量关系。例如将家庭人口数与家庭总支出对比计算家庭人均支出水平。二、单变量的统计描述方法基本描述集

2、中趋势离散趋势定类层次次数、比例、比率、表格、图示众数异众比率定序层次次数、比例、比率、表格、图示、累计次数、累计百分比中位数四分位差定距层次次数、比例、比率、表格、图示、累计次数、累计百分比、分组均值标准差(一)分布统计表统计图1、分布统计学里的分布是指一个概念或变量,它的各种情况出现的次数或频数,也称频次分布。如住房产别包括12种情况,按被访人的回答,可以得到12对数据:(x1,n1),(x2,n2)…(x12,n12).括号中的第一项表示变量的可能选项,第二项表示所对应的频次。需要注意的是:(1)变量取值必须完备,只有这样才能使被访者一一无遗地进行归类。(2)

3、变量取值必须互斥,这样才能使每一个观察值归入一类,且仅仅归入一类。2、统计表用表格形式来表示变量的分布。统计表必须具备的内容有:表号(统计表x,x),表头(包括标题、时间、地点),标识行(产别、频数、频率),主体行(第一项位置,按列填写变量的不同选项;第二项位置,按列填写变量取值相应的频次和百分比等等)。要写明统计的总数。表尾需要写清资料来源。定类变量的统计表表1、天津市居民住房的产别分布(1997)产别次数百分比1、直管公产43143.12、单位产16916.93、自有资产13713.74、房改购全部产权18718.75、房改购部分产权525.26、合作产权20.

4、27、军产101.08、宗教产101.012、其他产20.2Total1000100.0教育fcfcf%C%C%一级685506812.4100.012.4二级9048215816.387.628.7三级10639226419.371.348.0四级19328645735.152.083.1五级939355016.916.9100.0总数550100.0定序变量统计表表2某企业员工的教育水平定距变量统计表表3、天津市不同收入组居民的住房与收入现状(1997)收入的十等份分组使用面积(平方米)居住面积(平方米)月租金(元)家庭月平均收入(元)128.4919.

5、3417.68472.00233.6523.0426.28726.83336.3823.7122.90867.42432.4522.0224.571003.86536.1724.2924.211154.36638.9026.9226.961306.41740.0826.6429.951481.37842.2526.973.641673.79943.5826.8029.131995.301058.7034.6630.422955.38定距变量制表需要考虑的问题1、组数组数太少会掩盖变量变动时频次的变化,组数太多,会使每组内频次过少,看不出明显的规律。一般根据理论和经验

6、进行分组。2、等距分组与非等距分组一般情况下采用等距分组,但研究一些特殊问题,如贫困问题,需要对低收入分得细一些。3、组限(classlimits)就是每组的范围,包括上限和下限。对于离散型变量一般采取相邻组限不重叠的原则,而对于连续型变量,可能出现相邻组限重叠的情况,这时采取的原则就是“上组限不在内”原则。4、分组步骤第一,搜集数据;第二,在数据中找出最大值L,最小值S及极差值R;第三,把数据分组,如K组;第四,计算组距h;第五,计算组中值。3、统计图定类变量:圆瓣图;条形图定序变量:条形图定距变量:直方图;折线图(二)集中趋势测量法(1)集中趋势测量法(meas

7、uresofcentraltendency):就是找出一个数值来代表变量的资料分布,以反映资料的集结情况。该方法的意义,就是根据该代表值(或称典型值)来估计或预测每个研究对象的数值。(2)运用该方法要舍去变量的某些信息,但由于所根据的数值最有代表性,所产生的误差最小。(3)有三种方法供选择集中值:一是根据频次,哪个变量值具有的频次最多,就选择哪个变量值。二是根据居中。三是根据平均。表4、各种集中趋势量度的比较均值中位数众数适用于定距数据适用于定序数据适用于定类数据计算时要用到全部数据只需中间数据可最快求出受极端值的影响对极端值不敏感有时对个别值的变动也很敏感分组

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。