资源描述:
《近红外光谱分析中异常值的判别与定量模型优化》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第24卷,第10期光谱学与光谱分析Vol124,No110,pp1205-12092004年10月SpectroscopyandSpectralAnalysisOctober,2004近红外光谱分析中异常值的判别与定量模型优化闵顺耕,李宁,张明祥中国农业大学理学院,北京100094摘要介绍了利用马氏距离、Cook距离、光谱特征异常值、光谱残差比、化学值绝对误差等指标结合数理统计检验来判断光谱和化学值的异常,并利用这些方法进行近红外光谱定量分析中模型优化,取得了很好的效果。主题词近红外光谱;异常值;模型适应性;模型优化;马氏距离;多元回归中图分类号:O657
2、13文献标识码:A文章编号:1000-0593(2004)10-1205-05外光谱定量分析过程中必须首先解决的问题。本文介绍了如引言何利用光谱的马氏距离、Cook距离、光谱特征峰异常值、光谱残差、化学值绝对误差等指标结合统计检验来对近红外光近红外光谱分析是一种多组分分析技术,近年来广泛应谱定量分析中建模过程中的一些异常情况进行判别的方法,[1]用于农产品、化工、医药等领域的质量分析。在近红外光提高近红外光谱定量分析结果的可靠性。谱定量分析过程中,分析结果的可靠性首先取决于原始数据的准确性,即获得光谱及化学值的可靠性;其次还取决于近1实验部分[2-4]红外
3、分析模型的适应性。由于测量仪器、测试方法和环境等客观因素的影响以及技术人员本身主观因素的作用,再111仪器和试剂加上样本来源的多样性,用同一个模型分析不同来源的样品SpectrumOneNTS傅里叶变换近红外光谱仪(美国也可能存在模型不适应的问题。异常值的出现是可能存在上PerkinElmer公司):Quant+V4110(美国PerkinElmer公司),述两种情况的标志,因此异常值的判别和处理是提高近红外SPSSV1010;漫反射积分球附件;InGaAs检测器;50个小麦分析质量的一个重要步骤。样品,90个玉米样品,环己烷、正己烷、苯、甲苯四元混合就近
4、红外光谱定量分析来说,其数据异常不仅是指光谱体系,所用试剂均为分析纯。或化学值的测量值与真实值的显著性异常,还应包括该样本112实验方法的光谱或化学值与建模集中样本的平均光谱或化学值范围的11211样品制备显著性差异,一般可分为光谱异常和化学值异常。导致光谱小麦和玉米样品用旋风磨磨碎,过40目筛,样品存放在异常的主要原因有:(1)测量仪器和性能参数的变化,如仪干燥器中备用。每个样品的蛋白质含量由凯氏定氮法测定。[5]11212光谱采集与定量分析方法器能量的变化;(2)测量方法的变化,如制样条件的不同;(3)测量环境的变化,如温度和湿度的变化;(4)样品其他
5、物把一定量样品放在专用的样品杯中,采用积分球和旋转[5]台测定样品NIR漫反射光谱(以标准陶瓷片为参比),仪器参理或机械特性的变化,如粒度、黏度、光洁度等变化;(5)-1-1样品来源的变化,使得吸光度或某些特征峰强度异常,如产数:扫描范围10000~4000cm;分辨率8cm;扫描30地、放置时间、储存方式、采摘期和耕作方式等变化;(6)样次求平均光谱;近红外定量模型采用Quant+V4110中的偏品变质或弄错等失误。化学值异常的主要来源有:(1)所用仪最小二乘法(PLS)建立。器和方法的可靠性;(2)测定方法的变化;(3)样品来源的变113近红外模型评价
6、参数化;(4)操作人员的失误,如在测量过程及数据录入过程中(1)马氏距离(Mahalanobis.distance)的失误。光谱的马氏距离是指样本光谱与标准光谱集的平均光谱光谱的异常一般可以通过直接观察样品光谱本身来确之间的距离,计算公式如下,2T-1定,也可以通过样本在主成分空间的分布来确定,但是受人Di=(ti-t)Cov(t)(ti-t)为因素影响较大。如何客观地、科学地处理异常数据是近红Cov为标准光谱集因子分析中得分阵(Score)的协方差收稿日期:2002-12-26,修订日期:2003-05-06作者简介:闵顺耕,1963年生,中国农业大学(
7、西区)理学院副教授1206光谱学与光谱分析第24卷阵,ti为样本i的得分(Score)向量,t为标准光谱集每一因子的平均得分值。对光谱数据标准化处理后,每个样本的马氏距离大小由下式决定:TT-1hi=ti(TT)tihii可用来衡量一个样本对于整个标准样品集影响(Leverage)。在近红外定量分析中,hi表达了样本i对回归模型影响大小,如果hii太大,表明该回归模型对i样本的依赖性较大,对模型稳定性不利,换句话说,i样本可能异常。(2)Cook距离Fig11Distributionofcontentresidualof50wheatsamples在线性回
8、归分析中,Cook检验主要用于检验某样本在模型中存在与否对回归系数