基于红外光谱数据的中药药性识别研究

基于红外光谱数据的中药药性识别研究

ID:27337492

大小:61.00 KB

页数:10页

时间:2018-12-02

基于红外光谱数据的中药药性识别研究_第1页
基于红外光谱数据的中药药性识别研究_第2页
基于红外光谱数据的中药药性识别研究_第3页
基于红外光谱数据的中药药性识别研究_第4页
基于红外光谱数据的中药药性识别研究_第5页
资源描述:

《基于红外光谱数据的中药药性识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于红外光谱数据的中药药性识别研究作者:刘进,邓家刚,覃洁萍,冯旭,王丽丽,罗祖良,韦日伟【摘要】目的探讨中药红外光谱与药性的相关性。方法以红外光谱数据为分类指标,用主成分分析提取主成分,然后采用交叉验证法对不同药性中药进行交叉训练,建立中药药性的预测模型。结果该模型对预测集中平性药的识别正确率为83.33%,对非平性药的识别正确率为82.5%,总正确率82.89%,结论中药红外光谱与药性具有一定的相关性。【关键词】主成分分析;支持向量机;红外光谱;中药药性  Abstract:ObjectiveToexploretherelationshipbetedicine(TCM)andinfrar

2、edspectrumdata.MethodsTheinfraredspectrumdataofTCMethodthroughSVM,soastoestablishtheneutralandnon-neutralpropertyofTCMpredictionmodel.ResultsThemodelrecognitionaccuracyfortheneutralmedicineinpredictionsetedicine,adeupanaccuracyof82.89%inaverage.ConclusionTheinfraredspectrumandpropertiesofTCMhavesom

3、erelevance.  Key;TCMpropertyrecognition  红外光谱是利用物质分子对红外辐射的选择性吸收,用红外分光光度计测得的包含物质分子结构信息的光谱图。由于红外光谱具有特征性强、取样量小、简便迅速、准确等特点,近年来其应用得到较快的发展,各国药典都将红外光谱作为法定的药物鉴别的主要方法,与此同时也越来越多地应用于中药材的识别研究。  中医药是我国的传统医学宝库,中药药性理论是中国传统医药的核心理论之一,是中华医学理论体系中的一个重要组成部分。对中药药性的研究自古有之[1~3],并已成为指导中医用药的指导原则[4]。然而,中药药性的机理至今尚未被人们所彻底了解,一般

4、认为,中药中的化学成分或某些药效团是中药药性的物质基础[5,6],但其与药性的相关性目前尚不为人知;由于红外光谱是利用物质的分子对红外辐射的吸收得到的与分子结构相应的红外光谱图,因此,如果中药中的化学成分或药效团确实与药性相关,那么其红外光谱与药性应具有一定的相关性。正是基于这种想法,本文尝试将主成分分析技术与支持向量机方法相结合,利用中药红外光谱数据进行建模分析,探讨中药红外光谱数据与药性的相关性,取得了较好的效果。现报道如下。  1基本原理简介  1.1支持向量机分类原理支持向量机[7](SupportVectorMachine,SVM)是从统计学习理论发展起来的一种机器学习方法,该方法

5、不仅支持小样本情况下的识别分类,而且具有较好的泛化性,从上世纪90年代初提出以来已成为模式识别的一个重要方法,目前已广泛应用于生产实践与科学研究的各个领域,例如文本的分类与识别[8,9]、蛋白质功能的预测[10]和药材的分类与识别[11]等,其分类原理是通过定义适当的内积函数ψ(·)将数据从输入空间映射到高维解空间,然后在这个高维解空间中构造超平面  ω·ψ(x)+b=0①  再利用结构风险最小化原则,及Karush-Kuhn-Tucher条件,建立最优分类判别函数  y(x)=sign[∑xi∈SVαiyiK(xi,x)+b]②  这里K(xi,x)=ψ(xi)Tψ(x)称为核函数,xi∈

6、SV称为支持向量。通过判别函数②即可实现数据的分类。  1.2主成分分析将红外光谱原始数据作为支持向量机的输入,通常存在两个问题,第一,红外光谱数据一般都是高维向量,维数从几十到上千不等,导致向量变量与样本数的比值过大,直接影响支持向量机建模的可靠性;第二,红外光谱数据往往包含有大量的重叠信息,数据矩阵存在大量线性相关的变量向量。因此利用支持向量机进行建模前,首先要对红外光谱数据进行压缩或降维,在保证不丢失光谱主要信息特征的前提下,将高维的光谱数据转化为低维数据,以作为支持向量机的输入。主成分分析法[12](principalponentanalysis,PCA)是目前使用最广泛的线性降维方

7、法之一,该方法的最大特点是对原数据进行线性变换,保留方差大、包含信息量多的变量,丢掉方差较小、包含信息量少的变量,然后通过重新线性组合求出新的分量,达到降低光谱数据维数的目的,其基本原理[13]是将被分析的数据矩阵Xm×n分解成下面形式:  X=TPT+E③  其中Tm×a称为得分矩阵,Pn×a称为载荷矩阵,Em×n为残差矩阵,T、P均为正交矩阵。在所能容忍的残差范围内,X近似地表示为  X=TPT④  将④

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。