欢迎来到天天文库
浏览记录
ID:39812931
大小:3.22 MB
页数:139页
时间:2019-07-11
《第8章 - 副本》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、《市场调查》第八章描述分析11月21日目的1:数据整理目的2:集中趋势指标目的3:相关分析第1节数据分析方法的选择选择数据分析方法,需要考虑那些因素?调查目的,调查设计阶段,就应考虑分析方法;分析数据的类型;数据的分布特征;受众调查中所涉及变量数量及变量的水平数目一、调查目的探索性调查定性分析方法内容分析法将资料经过转换后,也可进行统计分析描述性调查平均数、中位数、众数等集中量数标准差、偏离度、峰度、差异系数等离散量数相关系数推论性调查参数估计假设检验(如Z检验或T检验)复杂的多元统计分析二、数据类型一名义数据:只表示类别的不同,无顺序和大小区别。百分比列联相关百分数检验和卡方
2、检验方法顺序数据:表示类别,有顺序的先后。中数、百分位数等级相关等级变异数分析秩次检验等方法等距数据:具有相等的单位,但没有绝对的零值。可用平均数、标准差、积差相关t检验、Z检验、F检验方差分析、回归分析等统计分析方法等比数据:既具有相等的单位,也具有绝对零值。适合等距数据的分析方法同样适合等比数据几何平均数及差异量数二、数据类型二数据类型其他划分标准离散数据:数字一般是取整数,两个单位之间不能再划分细小的单位(名义与等级)连续数据:单位可以进行无限细微地划分,细微的程度能达到只可想象而不能看见的程度(等距与等比)三、三种常见的数据分布特征正态分布正偏态分布负偏态分布正态分布时,
3、那么选择算术平均数是最好的;偏态分布(正偏态与负偏态)时,那么选择众数则是最理想的调查数据的分析中应用得最多的是正态分布,算术平均数、中位数和众数都相同,而且其分布的形式是左右对称数据分布形态对于参数估计及参数检验具有重要的意义名义数据和顺序数据来说,只能适合于非参数检验等距或等比数据,分布正态,适合作参数检验四、变量的数目及变量的水平数量变量的水平数量自变量的水平多少与统计方法的选择具有密切的关系变量的数目单变量分析双变量分析多变量分析第2节数据整理数据整理(数据预处理):对所收集的原始资料进行检验、汇总,使其系统化、条理化、科学化,以得出反映事物综合特征的资料的过程。包括资料
4、检查:可靠性检查:主要对第二手资料,应来自权威部门完整性检查:补充不完整(漏填)、不完善的资料。逻辑检查:数据过高、过低,分项不等于总项,前后矛盾。资料检查在统计调查时就要进行,调查的当时和晚上进行,便于弥补和改进。录入、资料存档缺失值处理用样本统计量(如平均值)代替用统计模型计算出的值代替删除缺失的记录(list-wise)保留有缺失字段的记录,仅在相应分析时排出(pair-wise)加权处理使样本更具代表性或强调某些被访者群体的重要性变量的转换量表的逆陈述分类或编码由原始变量计算新变量第2节数据整理一、统计分组根据被调查对象的特征和统计分析的目的,将所得数据进行适当的分组或分
5、类。是最基本的统计分析方法。1、统计分组的方式分组、计数编制频次、频率分布表2、统计分组的原则组内一致性和组间的差易性。穷尽原则,每个单位都应归组。P30互斥原则,每个单位只能归于一个组有利于发现规律。频次、频率的分布案例:文化创意产业乱象美国受众分析中最重要的分组(Y110)18—34岁的女性,18—34岁的男性;18—49岁的女性,18—49岁的男性;25—54岁的女性,25—54岁的男性;12—17岁的青少年,2—11岁的儿童。这些组是广告主最渴望达到的,是大多数节目的目标受众。美国13种频道类型(Y390)基础频道;儿童频道;体育频道;国外频道;生活方式频道;色情频道;电
6、影频道;音乐频道;购物频道;新闻频道;宗教频道;西班牙频道超级频道(大城市、体育和电影节目)3、编制步骤求全距决定组数与组距:组距最好相同组数的经验公式N为数据个数,K取近似整数表8-4组数与数据个数的关系N10020050010002000K1216223039列出分组区间计算次数,上限不在内原则编制次数分布表组中值=(下限+上限)/2【假设均匀分布】二、编制统计表的八项注意1.标题简明:相当于导语2.主词和宾词:主词和宾词(即行和列)一般可互换,一般行多列少。全部列出时先局部后整体,部分列出时先整体后局部。3.标明计量单位:全表只有一种计量单位时,写在表的右上方;有多种计量单
7、位时,横行的计量单位可专设“计量单位”一栏,纵栏的计量单位与纵标目写在一起,用小号字。4.数值按小数点对齐,相同数据应照写,不能用“同上”、“同左”、“··”表示,“——”表示无数据,“……”表示缺数据。二、编制统计表的八项注意5.统计表一般用开口式,及表的左右两端不画纵线,上下用粗线封口。6.栏目较多时,应加编号。主词栏用A、B、C、D等文字标明,宾词栏用1、2、3等数字标明。7.必须标明资料来源。8.说明主要栏目之间的对应关系。特别是多张表时,表内、表间的关系。如1=2+3+
此文档下载收益归作者所有