欢迎来到天天文库
浏览记录
ID:27800998
大小:312.20 KB
页数:30页
时间:2018-12-06
《数据分析的方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、数据分析的方法第1章数据分析的方法假设你从前任手中得到了表1.1所示的数据库,现在要知道从中能得到什么一—而且要尽快。老板走进来说,“这是上一任收集到的一些软件项目数据。里而有没有令人感兴趣的东西?我希望你在下周的管理会上就能给岀结果。”考虑到经常要花好几年时间才能收集到足够的软件项日数据用于分析,再加上软件界居高不下的跳槽率,因此,我们很可能分析由他人收集到的数据。数据是什么?简写代表着什么?应该使用哪些统计方法?首先应该做什么?先不要着急,往下看。经过长达8年的收集、验证、分析及界定软件项目之后,我才写出了这本书。以前,有人让我从欧洲航天局的软件项目
2、数据库中“找出令人感兴趣的东西”,我多么希望那时候就能看到这样一木书。在本章中,我将和大家分享自己的数据分析方法。在阐述任一步骤时,使用的都是表1.1中的软件项日数据。大家不需要理解工具条1.1中那份“步骤清单”后而的统计信息。日前我只简单地解释:做什么;为什么这么做;如何解释统计输岀结果;在各个阶段应注意什么。表1.1软件项目数据ideffortsizeapptelonusetl3tl427871647TransProNo443845130TransProNo445212721056CustScrvNo3264224383TransProNo54873
3、20209TransProNo4299125366TransProNo32152565249InfScrvNo24164047371TransProNo33171520211TransProNo3318259101849TransProYes3319372862482TransProYes312111039292TransProNo422510447567TransProYes22续表软件管理的应用统计学2ideffortsizeapptelonusetl3tl4265100467TransProYes2363694336827TransProNo421
4、74518530InfServNo45179838731CustServNo33295743032MISNo3496320433TransProNo3312337134TransProNo24385054838CustServNo43578730240MISNo24557822743TransProNo2310605944TransProNo33527929945InfServYes32811742246CustServNo32175519350TransProNo245931152651InfServYes43360050953TransProNo42
5、455758354MISNo53875231555CustServNo33344013856CustServNo431370042358TransProNo42462020461InfServYes32工具条1.1数据分析的步骤清单步骤清单:尽可能多的优质数据。一个统计分析软件包。很好的判断力。第1步:验证数据第2步:选择变量及模型第3步:执行前期分析(使用图表、表格、相关性及逐步回归分析)第4步:建立多变量模型(使用方差分析)第5步:检验模型第6步:提取方程式第1章数据分析的方法3完全理解了本章中解释的第1〜6步后,可以接着阅读第2〜5章中的案例研究,
6、取得一些较复杂数据库分析的经验,学习如何把这些方程式转变成管理方法。参见第5章,那里有个例子演示了如何把分析成果呈给顾客。如果有时间,还可以参见第6章,进一步学习这份“步骤清单”中用到的不同统计方法。数据验证最重要的步骤就是数据验证了。与分析数据相比,在数据验证上花费的时间要多得多。通常,数据并不像木书这样用一张表格干脆利落地被展现给我们,相反,数据存在于多个有待合并的文件中,这些文件中还可能包含一些自己不需要或不理解的信息。数据也会存在于多份纸介材料中。数据验证到底指什么?一般意义上,这指的是,查明数据是否确实满足要求,撰写问卷并让人们填写这些问卷。这
7、并不够,大家还要有点先见之明。这就像在开始开发软件之前,先耍得到需求规范一样。特别地,大家需要判断各个变量的取值是否有意义。如果收集数据时脑子里既没有明确的目标,也没有统计分析需求,那么只是理清数据头绪就会浪费数月时间。在开始分析数据之前,最好先对拥有的数据、对这些数据的信任程度等有个确切的想法。不管数据涉及到的是巧克力的销售,还是金融指标、软件项目,它都适用一句古代谚语一一“进去的是垃圾,出来的还是垃圾”。如果在数据分析结束之后才发现原始数据出错了,那么结论将毫无意义。即使在最好的情况下,我们也要进行一些校正,然后重新从头分析。然而,如果问题起因于变量
8、的定义,也许就不可能再回去接着收集所需的数据了。如果是自己负责收集数据,则要确保
此文档下载收益归作者所有