欢迎来到天天文库
浏览记录
ID:59212772
大小:320.01 KB
页数:30页
时间:2020-10-30
《第二讲 单变量统计描述.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二讲单变量统计描述一、分布(xini)x的要求:n:频次分布(1)完整性P:概率分布(2)互斥性%:百分比分布为什么?如:性别xi人数ni男5女6例:某校学生的父亲职业职业np%干部工人农民1101522280.2000.2760.52420.027.652.4总数5501.000100.0二、统计表统计表的制作要注意的问题:1、标题、内容简明2、统计栏数多时,要加编号3、数字填写:位数对准,同栏数字、小数位要一致,相同数字不的写“同上”,无数字栏用“—”,缺资料“…”4、表中数字用同一单位时,标在右上角5、表的左右两端不封闭判断练习:分别
2、制作定类、定序、定距变量统计表注意:统计表的分组科学性问题判断:学校对最喜爱体育项目调查:项目名称人数百分比球类田径游泳赛车150100607060302020判断:学生成绩变化调查开学初期末成绩%提高下降不变好中差108010608075101010301015三、统计图圆瓣图。反映所占比例;使用于定类;条形图。定类:离散长条;定序:紧挨长条或离散长条;宽度无意义;直方图。紧挨长条;宽度有意义;适用于定距;高度:频次密度=频次/组距折线图。直方图顶点中心相连;要计算组中心值。看一看,这是一个什么东东?课内练习根据以下资料:好:1000;中:
3、2000;差:50001、能否制成直方图?Why?2、如果作成条形图,对变量值的排列是否有要求?3、作图四、频数统计cf↑:向上累计。小于某一数字的频数cf↓:向下累计。大于某一数字的频数年龄人数cf↑cf↓153318166915189189五、集中值三种方法找集中值:频次;居中;平均;想一想:社会经济生活中有哪些集中值?1、众值M0频数最多的变量值,适合于单峰对称。2、中位值Md数据序列中央位置之值。未分组数据:1)根据原始资料求中位值奇数时中位值=(N+1)/2偶数时中位值中间位置左右两位数的平均值为中位值。2)根据频次分布求中位值未分
4、组资料:首先确定中位值的位置(利用cf↑)第二步找中位值。分组资料:四步求值方法1、找50%区间2、找上界U、下界L;U%—L%3、求累计50%的变量值X4、中位值=L+X例:某农村妇女初婚年龄求中位值注意:真实组界的问题年龄频次频率cf↑16-183030%30%18-205050%80%20-222020%100%3、均值适用于定距变量,能综合反映频次、次序、数值大小变化未分组数据1)直接累加:算术平均例2)根据频次:加权平均均值=分组数据:以中心值来代替变量值,但有误差例。例:调查某地6户农民家庭和5户干部家庭,每户人数如下:农民家庭:
5、6;4;4;8;6;3;干部家庭;4;2;3;3;5;求均值。例:青年人每年阅读书本数调查,求均值。书数人数2-45-78-1011-1314-1617-19245321总数17六、标志变异指标测定离散趋势,考察资料的分散特征1、异众比率非众值的比例越小,则众值的代表性越大。例2、极差R=观察最大值-观察最小值例3、四分互差Q=Q75–Q25例1例24、方差、σ与标准差未分组1)根据原始资料标准差=2)根据频次分布:例:例:以下19位学生每月零花钱的调查:100以下:6;100-200:10;200以上:3求异众比率。例:以下是大学生每月餐
6、费开支调查,求极差。250;240;300;420;500;450;590;440;380;240;550;360;400;例1,根据原始资料求中位值调查甲村的家庭人口数,如下:2;2;3;4;6;9;10;11;13;15;求中位值。例2,根据分组资料求以下是1209名吸烟者年龄统计,求四分互差年龄人数百分比CF↑21-2421225-3427335-4425745-5422655-6415265以上89合计例:某校教师20名调查,每月买书支出:40元,10人;50元,7人;60元,3人。求标准差。练习将学校的某个现实问题作为选题,进行一次
7、抽样调查,样本不少于30个,写出调查方案,调查后将收集的数据进行分组整理,制成统计表和统计图,并作适当的分析。5人一组,每组提交一份文字报告
此文档下载收益归作者所有