徐书环应用统计论文

徐书环应用统计论文

ID:46544500

大小:57.50 KB

页数:5页

时间:2019-11-25

徐书环应用统计论文_第1页
徐书环应用统计论文_第2页
徐书环应用统计论文_第3页
徐书环应用统计论文_第4页
徐书环应用统计论文_第5页
资源描述:

《徐书环应用统计论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于聚类分析的区域大中型工业企业自主创新能力的划分徐书坏管理科学与工程20100409摘要为了对区域大中型工业企业口主创新能力进行全面、科学的评价,基于聚类分析法,提出了地区大中型工业企业自主创新能力评价指标体系及聚类分析模型。通过对我国29个省市区大中型工业企业的实证分析,表明该方法科学简便,具有很好的实用价值,可以应用到多个方血。关键词聚类分析大中型工业企业自主创新1引言聚类分析又称群分析,是研究对样品或者指标进行分类的一种多元回归统计方法。聚类分析的目的是,通过观测数据所进行的分析处理,按一种度量个体接近程度的统计量,确认分类数冃,建立一种分类方法,并按

2、接近程度对观测对象给出合理的分类。聚类分析方法被应用到许多实际领域,木文研究其在对中国各省市大中型工业企业创新能力划分中的应用。中国各省市大中型工业企业的□主创新能力,在许多方面都存在较大差别,但我们叮以发现有部分省份在各方面的数据特征极为相似,通过归类我们可以从大类上了解各省份大中型工业企业创新方面的特点。因此木文利用聚类分析方法,把全国各省分成几类,通过对大类的比较分析,找出各自的优势与劣势,可以为各省大中型工业企业自主创新能力的提升提供一些参考依据。2聚类方法介绍聚类方法是对样品即个体以某种相似性为度量标准进行分类的一种计量方法。简单地说,是一种研究“物

3、以类聚”问题的探索性方法,将一批样本数据按照其亲密程度在没有先验知识的情况下口动进行分类。传统的聚类算法主耍有k-means聚类方法、层次聚类方法、系统聚类方法,本文主要采用k-means的算法来划分不同区域。S面对k-means算法加以简单介绍。k-means算法是以平均值作为类的“中心”的一种分割聚类方法。用spss调用此过程可完成由用户指定类别数的大样木资料的逐步聚类分析。所谓逐步聚类分析就是先把被聚对象进行初始分类,然后逐步调整,得到最终分类。假设有川个对象,将其分成£个类。其中,分成的聚类的个数k是采用k-means算法必须预先指定的参数。聚类的过程

4、有以下步骤叫(1)随机地选择R个对象,每一个对象作为一个类的“中心”,分别代表将要分成的R个类;(2)根据距离“中心”最近的原则,寻找与每个对象最为相似的类,将其他对象分配到各个相应的类中;(3)在完成对象的分配Z后,针对每一个类,计算其所有对象的平均值,作为该类的新的“中心”;(4)根据距离“中心”最近的原则,重新进行所有对象到各个相应类的分配;(5)返冋步骤(3),直到没有变化为止。3各省市大中型工业企业自主创新能力区域的划分3.1创新能力评价指标体系的结构框架按照科学性、导向性、简明性和可行性原则,我们分析企业自主创新过程中涉及到的各影响因素,从潜在创新

5、资源投入能力、创新活动能力、创新产出能力和创新外部环境四个方面建立了企业门主创新能力评价指标体系,共包括8个具体指标(详见表1)。表1企业口主创新能力评价指标体系n标层—级指标二级指标自主创新能力体系潜在创新资源投入产品销售收入占全国产品销售收入的比重(%)/?&D人员屮科学家和工程师占从业人员的比重(%)创新活动能力R&D经费占产品销售收入比重(%)科技活动经费占产品销售收入比重(%)创新产出能力新产品销售收入占产品销售收入的比重(%)发明专利巾请数占全国发明专利巾请数比重(%)创新外部环境科技活动经费筹集中政府资金比重(%)科技活动经费筹集屮金融机构贷款比

6、重(%)(1)潜在创新资源投入能力。潜在的技术创新资源包括人力资源存量和经济资源存量,它主要反映某区域内的所有企业潜在的技术创新能力,选择了产品销售收入占全国产品销售收入的比重和R&Q人员中科学家和工程师占从业人员的比重两个指标來衡量。(2)创新活动能力。从企业技术创新活动的活跃程度角度选择了两个指标,分别是R&D经费占产品销售收入比重、科技活动经费占产品销售收入比重。(3)创新产出能力。从企业自主创新的实际产出与潜在产出方面精选两个指标,分别是新产品销售占产品销售收入的比重和发明专利屮请数占全国发明专利中请数比重。(4)创新外部环境。科技活动经费筹集中政府资

7、金比重和金融机构贷款比重这两个指标分别反映了政府部门与金融机构对企业创新的扶植与支持,是衡量企业创新外部坏境的重要指标。3.2数据采集本文中的数据主要來口2009年版的中国科技统计年鉴上2008年的全国齐省市大中型工业企业的相关数据。由于西藏和海南的数据资料不全,无法进行分析,因此收集整理了剩余的29个省市的相关数据,进行处理分析。相关数据见附录。3.3区域划分我们选用科技统计年鉴上的29条数据记录,以相关系数作为差异度度量方法,直接采用k-means算法进行聚类。将8个貝体指标用A,B,…,H表示,通过对R的不同赋值,得到不同的分析结果。经过反复试验,最后聚

8、成四类时,各类中对象比较集中,而类与类

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。