欢迎来到天天文库
浏览记录
ID:52441510
大小:321.48 KB
页数:5页
时间:2020-03-27
《血糖近红外光谱分析的 平滑模式与.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第38卷分析化学(FENXIHUAXUE)研究报告第3期2010年3月ChineseJournalofAnalyticalChemistry342~346DOI:10.3724/SP.J.1096.2010.00342血糖近红外光谱分析的Savitzky-Golay平滑模式与偏最小二乘法因子数的联合优选1*121,31谢军潘涛陈洁梅陈华舟任小焕1(广东省高等学校光电信息与传感技术重点实验室(暨南大学),广州510632)23(暨南大学生物工程学系,广州510632)(上海大学数学系,上海200444)摘要利用
2、偏最小二乘法(PLS)和光谱Savitzky-Golay(SG)平滑方法,建立血清葡萄糖近红外光谱分析的优化模型。基于最优单波数模型的预测效果,提出划分校正集和验证集的一种新方法。采用10000~5300-1-1cm和4920~4160cm的组合波段,光谱经过SG平滑处理,利用PLS方法建立定标预测模型。将平滑点数扩充为5,7,…,87(奇数),多项式次数扩充为n=2,3,4,5,6,得到包含582个平滑模式的14个平滑系数表。对所有平滑模式和PLS因子数(1~40)分别建立PLS模型。按照预测效果进行优选,
3、得到最优SG平滑模式为1阶导数平滑,3、4次多项式类型,SG平滑点数为53,最优PLS因子数为7,最优RMSEP达到0.376mmol/L。所采用的划分校正集和验证集的方法、SG平滑模式的扩充、SG平滑模式和PLS因子数的联合大范围筛选能够有效地应用于近红外光谱分析的模型优化。关键词血糖;近红外光谱;偏最小二乘法;Savitzky-Golay平滑;校正集验证集划分1引言随着光谱技术和化学计量学的快速发展,近红外光谱以其分析效率高、速度快、成本低、非破坏性和[1,2]易于在线分析等特点已广泛应用于农业、食品、烟
4、草、医药等领域。模型优化对于提高近红外光谱预测能力具有重要意义。偏最小二乘法(PLS)是融合主成分分析和多元线性回归的一种有效的化学计[1~7]量学方法,其中合理选用PLS因子数,对于充分利用光谱信息和消除噪声非常重要。在光谱预处理中,平滑可以保留光谱轮廓而消除噪声,求导则可以有效消除基线漂移、倾斜等噪声。Savitzky-Golay[8~11](SG)方法是应用十分广泛而有效的平滑和求导预处理方法。按照导数阶数(平滑看成0阶求导)、多项式次数和平滑点数的不同,SG平滑模式有很多种,计算公式也各不相同。其中平
5、滑点数的设置非常重要,点数过少容易产生新误差,点数过多则容易使包含信息的光谱数据磨光丢失,都会造成模型精度下降。根据预测效果对SG平滑模式与PLS因子数联合筛选是很有必要的,但由于工作量庞大,既往的研究很少做到这一步。另一方面,考虑到有些实际测量体系可能需要更多的平滑点数,比如测量数据波长间隔小的情形,相邻波长点的数据过于相似,点数少的平滑效果往往不够好。为了拓宽适用范[8]围,有必要按照原始论文的方法扩充平滑系数表。[3,4]血糖近红外光谱分析及其模型优化是很重要的研究方向。本实验以血糖近红外光谱分析为例,
6、研究SG平滑模式与PLS因子数的联合优化设计在近红外光谱分析模型优化中的作用。为了改善模型预测能力,基于最优单波数模型提出了划分校正集和验证集的新方法。2实验部分2.1实验材料、仪器和测量方法191份血清样品由广州市某医院提供,样品葡萄糖的含量由全自动生化分析仪测定作为光谱分析的参考化学值。全体化学值范围3.53~6.15mmol/L,均值、标准偏差分别为4.90和0.59mmol/L。实验仪器为5700傅里叶变换型近红外光谱仪(美国Necolet公司),探测器为铟镓砷(InGaAs)。用光程2009-06-
7、19收稿;2009-09-12接受本文系国家自然科学基金(No.10771087)、广东省自然科学基金(No.7005948)、广东省科技计划项目(Nos.2007A020905001,2007B030501008,2007B020714001)、广州市科技攻关项目(No.2007Z3-E0281)资助*E-mail:tpan@jnu.edu.cn第3期谢军等:血糖近红外光谱分析的Savitzky-Golay平滑模式与偏最小二乘法因子数的联合优选343-1-12mm的石英比色皿测量光谱,扫描谱区10000~4
8、000cm,分辨率4cm,扫描次数64。2.2校正集和验证集的划分方法基于全体样品最优单波数模型的预测效果给出划分校正集验证集的一种新方法。根据比尔定律,考虑血清样品吸光度与葡萄糖化学值的单波数线性模型A(v)=k(v)C+ε(1)其中,A(v)为样品在波数v的吸光度,k(v)为在波数v的葡萄糖单位浓度吸光系数,C为样品的葡萄糖浓度化学值,ε为其它未知干扰。在每个波数v,利用全体样品的吸光度和化学值
此文档下载收益归作者所有