欢迎来到天天文库
浏览记录
ID:51250204
大小:575.69 KB
页数:4页
时间:2020-03-22
《基于贝叶斯决策的近红外光谱药片分类方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第41卷分析化学(FENXIHUAXUE)研究简报第2期2013年2月ChineseJournalofAnalyticalChemistry293—296DOI110.3724/SP.J.1096.2013.20317基于贝叶斯决策的近红外光谱药片分类方法周扬2吕进戴曙光刘铁兵施秧葛丁飞李博斌。(浙江科技学院近红外应用技术研究室,杭州310023)(上海理工大学光电信息与计算机工程学院,上海200093)(国家黄酒产品质量监督检验中心,绍兴312071)摘要针对药片近红外光谱法分类过程中校正集样本数量过少且各类样本数量不均导致分类误差问题,提出了基于贝叶斯决策的分类方法。本方法对校正
2、集样本在各类中的先验概率密度和各类药片光谱的类条件概率密度进行了估计,利用贝叶斯全概率公式计算了待分类光谱分属于各类的后验概率,根据后验概率大小对药片分类。实验随机选取4类数量不等的西酞普兰药片70片,建立贝叶斯决策分类模型,对2O片验证集药片进行分类,各类的分类灵敏度和特异度均达到了100%,对比判别最小二乘法的分类结果,验证了贝叶斯决策分类法能将样本及其近红外光谱的分布信息参与分类决策,提高了分类的准确性和适应性。关键词药片分类;近红外;贝叶斯决策;参数估计1引言近红外光谱分类识别作为一种无损、快速检测技术,已广泛应用于制药行业。在制药过程的在线控制,药物活性成分检测和真假药的判
3、别等领域都有成功应用的报道_lq】。随着化学计量学的发展,一些模式识别方法,如神经网络、支持向量机印等被成功应用于近红外光谱的建模分析,提高了分类模型的预测精度和稳健性。对模式识别方法不断改进,运用波长特征选择和变换方法,将建模策略应用到建模过程是药品光谱分析的主要研究方向。但是这些研究却很少涉及建模药品本身数量、分布等情况。在样本足够多的情况下,纵然可以使用样本选择方法网和局部样本建模策略进行样本选择性建模,而实际情况往往是建模样本数量少,不同类样本的数量不均,使得预测结果向样本数量最多的模式类倾斜,导致预测结果的偏差。通常,校正集样本在不同类中应具有均匀分布,而在样本数量不多和不
4、同模式类样本不均匀的情况下,单纯使用有监督的模式识别方法会产生偏差[1们。针对上述问题,根据贝叶斯概率决策(Bayesian)理论,用校正集样本的先验概率分布和类条件概率分布推算待分类样本在不同模式类后验概率分布,提出了根据后验概率大小对验证集样本进行分类决策的方法。本实验采集了4类不同药片的近红外光谱,在校正集样本数量小、样本总体在不同类中非均匀分布情况下,研究了贝叶斯决策法在药品近红外光谱分类应用中的可行性和有效性。2实验部分2.1药片样本与光谱采集实验用药片及分类数据由丹麦哥本哈根大学提供。样本为西酞普兰(Citalopram)90片,根据内部活性物质含量的不同,将药片分为A、
5、B、C和D4类,且这4类药品中西酞普兰有效成分分别为5mg~15%,10mg~15%,15mg~15%和20mg~15%,A类和D类药品2O片,B类和C类药品25片。使用ABB公司MB一160型傅里叶变换近红外光谱仪测量药片的近红外光谱,扫描波数范围为7400—10507cm~,每个光谱含407个波长点,光谱如图1,其具体信息可参见文献[11]。文献[11]研究表明,均值中心化和多元散射校正预处理方法能有效提高预测精度,后续实验继续采用这两种方法进行预处理。校正集随机抽取A类和D类药品15片,B类和C类药品20片,每类各剩5片(共20片)作为验证集。2012~5-26收稿;2012—
6、10.11接受本文系国家自然科学基金项目(No.51075280),浙江省重大科技专项和优先主题计划项目(No.2010C11060),浙江省自然科学基金项目(Nos.Y1100219、Y4110235)和浙江省质监系统2011年度科研计划项目(No20110234)资助E。mai1:zybuaa@163.com分析化学第4l卷2.2贝叶斯决策分类方法定义为药片校正集光谱(个样本,m个波长点),设每个类的样本有n个,则∑n=凡。pred为某一待分类药片的光谱(同样具有个波长点),首先用主成分分析(PCA)对光谱进行压缩_1,获得光谱矩阵非零特征值对应的q个主成分得分,校正集光谱和待分
7、类药片光谱就变换为~XOa和pred。进一步定义:P(∈)为校正集中药片分属于不同类的概00率密度,即先验概率密度;P(l∈i)为第i类药片光谱值的概率密度,即类条件概率密度;P(∈iI)药品的近红外透射光谱测得药片光谱为的情况下该药片属于i类的概率NIRtransmittancespectraofthedrugs密度,即后验概率密度。P(∈i,P(I∈i)和P(∈J)为某一待分类药片对应的概率值,以P字母的大写区分。药片近红外光谱的贝叶斯决策分类法首先利
此文档下载收益归作者所有