部队装备新旧状态的大数据分析报告

部队装备新旧状态的大数据分析报告

ID:47570115

大小:3.69 MB

页数:10页

时间:2020-01-15

部队装备新旧状态的大数据分析报告_第1页
部队装备新旧状态的大数据分析报告_第2页
部队装备新旧状态的大数据分析报告_第3页
部队装备新旧状态的大数据分析报告_第4页
部队装备新旧状态的大数据分析报告_第5页
资源描述:

《部队装备新旧状态的大数据分析报告》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、......部队装备新旧状态的大数据分析王玉琢,张建军(海军工程大学理学院应用数学系,武汉430033)摘要:对已获得的模拟大数据进行了清洗和关联的预处理工作。以高程、经度、纬度、装备类型、部队种类5个方面作为影响因素,建立了3种方差分析模型,分别讨论了每种因素对装备新、堪、待、废4种状态的影响情况,以及各种因素联合起来产生的联合效应。通过计算相关系数,将每种因素与装备状态的关联程度进行量化比较。所得结论和提出的建议对部队的装备保障优化具有一定的意义。关键词:数据预处理;单因素方差分析;无交互作用双因素方差分析;

2、有交互作用双因素方差分析近年来,随着互联网技术的飞速发展,军队信息化也得到加快,各种军事资源数据的采集、储存与利用,为部队的现代化建设和科学化管理提供了有力的支持与理论依据。但是面对海量信息,如何结合部队实际,真实高效地利用这些数据资源做好部队的装备保障与维护工作,是当前亟待分析解决的一个重要问题[1]。装备的磨损消耗情况,是保障维护工作中常关心的问题,它除了与装备本身的耐用性、维护保养情况、使用频率这些因素直接相关外,还受到如气候条件这类因素的间接影响[2]。然而,出于保密等原因有些数据无法获得,即使这些数据是

3、重要影响因子样本。为了便于研究,本研究基于已获得的模拟数据进行讨论,这些数据或许不是重要影响因子样本,但所用方法具有可复制性,结论具有参考性,可供有关管理部门借鉴。1数据采集通过添加随机扰动项对原始数据实现模糊处理,本文获取了部分部队的地理位置及装备状态的模拟大数据。在大数据背景下,文中所用的检验统计量依大数定律仍可以反映出总体特征。部分数据如表1、表2所示。表1中包含9439支部队的经度、纬度、高程3种地理位置信息。其中部队层次码采用多层变长的数字结构,两位一个层次,前1~2位为大单位名称编码,第3~4位为下一

4、级单位名称编码,用来体现单位之间的上下级关系。如400009与400101属于同一级大单位,65020904与6502090203同属一个大单位,前者比后者高一级别。表2中共有163178条装备状态数据,包含装备当前的新旧状况、购买日期、现有数量3类信息。其中装备层次码3位为一个层次,用来反映装备的类属关系和层次关系。如001001可能表示电脑配件大类中的液晶显示屏,001001001001可能表示该大类下的鼠标。装备新旧状况被划分为新、堪、待、废4种,分别对应内码01、02、03、04,用表3解释。表1部队地理

5、位置信息学习好帮手......序号部队层次码经度/(°)纬度/(°)高程/m140000999.1528.1607.2240010197.3229.36672…………………………307865020904121.136.2650.436797103000003119.0549.41177.6…………………………943999050102107.2835.161452表2部队装备状态信息表序号装备层次码部队层次码装备状况内码购买日期数量/个100100100100140010522010/9/3024320010010

6、0100140010542011/9/30192………………………………472500020030035704010432014/10/183…………………………1631770010050000000000009905020012013/9/3091631780010050000000000009905020022014/9/3010表3装备内码新旧状况装备状态内码说明新品01装备第一年为新品堪用02新品从第二年转为堪用待修03等待维修待报废04等待报废2数据预处理基于该数据,初步判断影响装备新旧状况的可能因素有5

7、种:部队所在的经度、纬度、高程、部队类型、装备类型。2.1数据清洗1)清除空间上无用的数据。考虑到我国军事单位大部分位于国境范围内,所以可将境外的部队地理信息视为无效数据进行剔除。中国国境范围为最北端漠河53°33′N,最南端曾母暗沙03°58′N,最东端黑瞎子岛135°05′E,最西端帕米尔高原73°49′E[3]以此作为筛选依据,从表1中去掉324条数据,剩下9115条部队地理位置信息。2)清除时间上无用的数据。表2中5年前数据量占比为0.15%,时间久远比重低,参考性不大。剔除掉此类数据247条后剩下162

8、931条装备状态信息。3)清除信息不完整的数据。通过比较发现,表2中有些部队层次码在表1中没有出现,即有些部队缺少地理位置信息,表1中有些部队层次码在表2中没出现,即有些部队缺少装备状态信息,这些数据对后续分析是无效的,需要学习好帮手......删除。运用MATLAB软件进行两层循环遍历后,删除的不完整信息接近30%,缩减了后续数据分析的工作量。2.2数据关联用EXCEL

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。