欢迎来到天天文库
浏览记录
ID:34036743
大小:62.70 KB
页数:19页
时间:2019-03-03
《对黑龙江各地区农业发展状况进行聚类分析和判别分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、黑龙江各地区农业发展状况的聚类分析和判别分析摘要:木文选择了2001年黑龙江省13个地区作为分析对象,选择了6个影响其农业发展的因素进行分析:农业增加值(万元)、林业增加值(万元)、牧业增加值(万元)、渔业增加值(万元)、实有耕地面积(万公顷)和乡村劳动力(万人)。利用SPSS软件对这些因素进行聚类分析和判别分析,进而将这13个地区区分为儿种类型,并对其分类进行判别分析,得到判别函数式,最后给出了回报判别,得出了判别正确率。关键词:SPSS;聚类分析;相关系数;判别分析;判别函数式引言:聚类分析是多元分析中研究“物以类聚”的一种方法,它在人们对社会、经济、技术系统的认识过程
2、中有着广泛的应用。作为从数值分类屮分离出來的一个数学分支,它从数据分析的角度,给岀在同一分类过程中始终如一的定量方法,从而避免了普通分类中主观随意性大的弊端,是一种更为准确、更为细致的科学分类工具山o判别分析是一种根据观测变量判断研究样本如何分类的多变量统计方法,它对于需要根据对样本屮每个个案的观测來建立一个分组预测模式的情况是非常适用的。判别函数是从一个每个个案所属的类别已经确定的样本中拟合岀来的,并且牛成的函数能够运用于同样进行了预测变量观测的新的样木点,以判断其类别归属。判别分析的基本原理可以表述为:在一个P维空间R中,有K个已知的总体Gl,G2,G3,GK,同时有样
3、本点X(XI,X2,X3,XP),它屈于且仅属于这K个总体中的一个,判别分析所要解决的问题是确定这个样本点X具体应该属于那一个G总体。实际上判别分析的过程分为两个部分,首先是依据已知样木及其预测变量建立起一系列分类规则或判别规则,其次是运用这一规则对样本的原有分类进行检验以确定原有分类错判率。同时如果原有分类具有较低的错判率,则建立起来的分类规则可以应用于实际工作中。判别分析的方法中较常使用的有Bayes判别和Fisher•判别;判别分析的结果对应着分析的不同步骤过程,也就包括了分类规则和分类结果两个部分。黑龙江省现辖13个地级行政单位,市下辖19个县级市、47个县、64个
4、区、464个镇、480个乡、9157个村。黑龙江省土质肥沃,地势平坦,耕地连片,水源充足,具有发展农业生产的良好自然条件。全省耕地面积960.1万公顷,是全国耕地最多的省份,人均占有耕地7.7亩。黑龙江省国营农场最多,103个大型国营农场拥有耕地206.8万公顷,占全省的21.5%,占全国国营农场的4.3%。黑龙江省是推行农业机械化较早、机械化作业水平较高的省份,至2001年底,全省拥有农业机械总动力164&3万千瓦,平均每一农村劳动力1・8千瓦。粮食总产量2651.7万吨,其屮豆类产量537.5万吨。SPSS11.0是世界上最优秀的统计软件之一,它易学易用、操作简单,对于
5、较大量数据的处理,更具优势,避免了大量的人工计算,保证了数据的准确性⑵。笔者选择了2001年黑龙江省13个地区作为分析对彖,选择了6个影响其农业发展的因素进行分析,六个变量为:xl——农业增加值(万元)、x2——林业增加值(万元)、x3——牧业增加值(万元)、x4——渔业增加值(万元)、x5——实有耕地面积(万公顷)和x6——乡村劳动力(万人)。利用SPSS软件对这些因素进行聚类分析和判别分析,进而将这13个地区区分为儿种类型,并对其分类进行判别分析,得到判别函数式,最后给出了回报判别,得出了判别正确率。1聚类分析笔者选择了2001年黑龙江省13个地区作为分析对象数据如表1
6、(来源于黑龙江农业信息网:http://www.hljagri.gov.cn),六个变量为:xl农业增加值(万元)、x2——林业增加值(万元)、x3——牧业增加值(万元)、x4——渔业增加值(万元)、x5——实有耕地面积(万公顷)和x6——乡村劳动力(万人)。Spss提供的聚类分析的方法一般有两种:一种是“快速聚类分析方法”(K-MeansClusterAnalysis),另一种是"层次聚类分析方法”(HierarchicalClusterAnalysis)⑶。若观察值的个数多或文件非常庞大(通常观察值在200个以上),则宜采用快速聚类方法。现在我们的分析对彖有13个样本,
7、所以用了层次聚类分析方法。层次聚类的基本思想是,它根据观察值和变量之间的亲疏程度,将最相似的对象结合在一起,以逐次聚类的方式(AgglomerativeClustering)将观察值分类,直到最后所有样本聚为一类。层次聚类分析有两种形式:一种是对样本(个案)进行分类,称为Q型聚类,它使具有共同特点的样本聚集在一起,以便对不同类的样本进行分析;另一种是对研究对象的观察变量进行分类,称为R型聚类,它使具有共同特征的变量聚集在一起,以便从不同类中分别选出具有代表性的变量作分析,从而减少分析变量的个数。木文笔者用spss中
此文档下载收益归作者所有