欢迎来到天天文库
浏览记录
ID:32418588
大小:429.50 KB
页数:8页
时间:2019-02-04
《基于pls的青藏铁路格拉段职工健康环境影响因素研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于PLS的青藏铁路格拉段职工健康环境影响因素研究科技部国家科技支撑计划资助项目(2006BAC07B01)。施庆生,陈建丽,李金凤(南京工业大学应用数学系,江苏南京210009)摘要:青藏铁路格拉段平均海拔4500米,沿线高寒、低氧、气压低、干燥、强辐射。本文采用格拉段沿线10个领工区的环境测试指标及相应工作人员生理指标数据,应用偏最小二乘(PLS)回归方法进行统计分析,探寻格拉段工作人员生理指标(脉搏、收缩压、舒张压、血氧饱和度)的重要环境影响因素,进行高原职业危害因素鉴定,并为制定相应的卫生保障措施提供依据。研究结果表明,气压、氧分压和海拔高度是影响地面作业人员生理指标的主要影响因素,
2、另外,格拉段高寒、多风的气候特点也是重要影响因素。关键词:青藏铁路;偏最小二乘;生理指标;环境影响因素中图分类号:O213.9文献标识码:A青藏铁路格拉段恶劣的自然环境,对长期工作、生活在这条铁路线上的工作人员的身心健康和劳动能力产生很大的影响[1]。本文采用对格拉段10个领工区的环境测试指标及相应工作生活人员生理指标数据采用偏最小二乘(PLS)模型进行统计分析,探寻高原环境与工作人员生理指标(脉搏、收缩压、舒张压、血氧饱和度)的关系,从而分析高原低压、缺氧、高寒、多风等自然因素对青藏铁路地面作业人员的影响,进行高原职业危害因素鉴定,为制定相应的卫生保障措施提供依据。一、多因变量偏最小二乘回
3、归原理由于本文所研究的是格拉段自然环境对地面作业人员多个生理指标之间的建模问题,样本量较少,自变量个数多且共线性复杂的高维数据。在这种条件下,多因变量偏最小二乘(PLS)回归模型是一个比较好的选择。偏最小二乘(PLS)回归分析在建模过程中集中了主成分分析、典型相关分析、多元线性回归分析方法的特点,具有计算量小、预测精度高、无需剔除任何自变量的优点,特别在自变量较多且共线性复杂的情况下相当有效。1、多变量偏最小二乘回归方法的基本思路设有个因变量和个自变量,取个观测样本点后构成自变量数据集和因变量数据集。偏最小二乘的基本方法是[2]:首先,在自变量数据集和因变量数据集中分别提取第一成分和,要求和
4、尽可能大地提取各自数据集中的变异信息,且和的相关程度最大。然后,建立对的回归及对的回归,如果回归方程达到满意的精度,则停止计算。否则,利用被解释后的残余信息以及被解释后的残余信息进行第二成分的提取,直到能达到一个较满意的精度为止。最后,偏最小二乘建立对最终对提取的个成分-8-的线性回归,然后再表达成关于原自变量的回归方程,即偏最小二乘回归方程。2、多变量偏最小二乘回归方法的基本算法第一步:将和进行标准化处理,标准化后的自变量矩阵和因变量矩阵分别记为和。第二步:从和中分别提取第一个成分,,,其中为的第一主轴,为的第一主轴。为了满足成分提取的要求,则需求解下列优化问题:由拉格朗日算法可得,为对应
5、于矩阵最大特征值的单位特征向量,为对应于矩阵最大特征值的单位特征向量。然后,分别求和对的三个回归方程其中,回归系数向量为。第三步:用残差矩阵和取代和,提取第二个成分,并求和对的回归方程如此计算下去,如果的秩为,则有由于都可以表示成的线性组合,以上两式可以还原为关于的回归方程:,其中系数体现了标准化的向量对的作用强弱。3、成分个数的确定偏最小二乘多数情形下只需选取前个成分就可以得到一个比较可靠的模型。如果后续的成分已经不能为解释提供更有意义的信息,采用过多的成分只会破坏对统计趋势的认识,引导错误的预测结论。对于成分的提取,本文采用广泛应用的确定成分个数的交叉有效性系数-8-来确定。对全部因变量
6、,成分的交叉有效性定义为对每一个因变量,定义为其中,,是原始数据中第个样本点在第个因变量上的取值,是利用前个成分回归建模计算得到的的估计值,是在样本点中去掉第个样本点,用个成分建模计算出的的估计值。当,或至少有一个时,可以确定成分个数为。三、格拉段地面工作人员生理指标自然环境影响因素的PLS回归分析1、变量与数据选取本文样本数据来源于中国铁道科学研究院环控劳卫研究所2007年11月5日到14日采集的格拉段各工区的环境测试数据和环境测试场所相应工作生活人员生理指标数据。剔除缺失数据,最后选择了格尔木、沱沱河、秀水河、五道梁、纳赤台、不冻泉、安多、那曲、当雄、拉萨10个领工区相关数据,分析所用数
7、据为环境测试指标及相应工作生活人员生理指标数据的平均值。自变量即环境测试指标为温度(x1)、湿度(x2)、风速(x3)、气压(x4)、氧分压(x5)、二氧化碳(x6)和海拔高度(x7)。因变量为相应工作生活人员脉搏(y1)、收缩压(y2)、舒张压(y3)、血氧饱和度(y4)。整理后数据如表1。表1:格拉段10个领工区环境测试指标及相应工作人员生理指标数据地点格尔木沱沱河秀水河五道梁纳赤台不冻泉安多拉萨那曲当雄
此文档下载收益归作者所有