欢迎来到天天文库
浏览记录
ID:24871660
大小:51.50 KB
页数:4页
时间:2018-11-16
《基于模糊k最近邻规则的葛根类药材的模式识别》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于模糊k最近邻规则的葛根类药材的模式识别【摘要】 目的:探讨模糊k最近邻算法运用于葛根类药材模式识别的可行性。方法:选择6种化学成分的含量,对不同产地的多种葛根类中药的药理抗内毒素活性建立了模糊k最近邻规则识别模式。结果:模糊k最近邻规则对葛根类中药的药理抗内毒素活性识别正确率达100%,优于经典k最近邻法与Bayers判别法。结论:模糊k最近邻算法可用于中药模式识别研究。【关键词】模糊k最近邻算法;k最近邻算法;模式识别;葛属 模式识别技术是一种借助数学方法和计算机技术来对样品的内部规律及隐含性质进行分析的综合技术,包括判别分析、聚类分析、机器学习等多种方法
2、。该技术已经广泛应用于各个领域,随着中药现代化进程,该项技术逐渐在中药领域深入应用。k最近邻法已被广泛应用于模式识别的分类器设计,所谓k最近邻法(KNN)就是取未知样本的k个近邻,看这k个近邻多数属于哪一类,就把其归于哪一类,在分类过程中KNN是采用简单多数投票法来确定未知样本的分类[1]。问题是,当学习样本类别分布不均的时候,如果仅考虑排序后的k个最近邻而忽视样本间的不同距离,势必会降低KNN的分类精度[2]。模糊k最近邻算法(FuzzyKNN,FKNN)就是将模糊理论与k最近邻法相结合的一种监督学习技术,它有效解决了上述问题,它将未知样本与k个最近邻的距离模糊化,并为
3、每个类别都设置了相应的隶属度,而不象KNN那样简单的将未知样本的归类定为“属于”或者“不属于”[3]。FKNN已被成功的应用于多个领域,在蛋白质结构预测[3]及文本分类[2]都有着不错的性能,本研究将FKNN应用于中药的模式识别,目前国内尚未见报道。 1FKNN算法的原理及实现 本研究的FKNN算法[4]不同于聂生冬等[5]将模糊c均值聚类与KNN简单结合,而是在KNN的基础上结合模糊理论进行归类决策实现的,其具体算法安排如下: ⑴设已知样本集合P={p1,p,…pn},n为已知分类的样本数,c代表分类数,u代表一个c×n的矩阵; ⑵确定未知样本的最近邻数k的值; ⑶选
4、择欧式距离范数d作为距离测度; ⑷对每个未知样本x: ①计算n个距离d=d(x,pj),并对其进行排序: pi∈P,且xP d(1)≤d(2)≤d(3)……≤d(k)≤d(k+1)≤…≤d(n) 其中d(1)到d(k)是未知样本x的k个最近邻与x的距离。 ②在u中找出对应于k个最近邻距离的k个列{uj},其中j=1,2,……k。 ③利用上一步从u中获得的k个列{uj},计算[4]: ui(x)=kj=1uij1d(x,pj)2m-1kj=11d(x,pj)2m-1 其中m为模糊权重调节因子,对于z=1,2,…,c,如果ui(x)=max{uz(x)},z≠i
5、,则x属于第i类。取下一个未知样本转到(4)继续,上述算法不是迭代过程,每个未知样本都必须按照上述算法处理一遍。 2中药葛根类药材的模式识别 中药模式识别通常是根据中药所含化学成分的整体进行分类或描述,识别该中药的真伪与优劣。葛根为豆科植物野葛或甘葛藤的干燥根,全世界已知的葛属植物大约有18种,我国是葛属植物的原产地之一,分布极其广泛,葛属植物有9个种和2个变种,其中7种与药用有关,研究结果表明,不同葛属植物中药用成分异黄酮含量和组分差异显著。曾明等[7]对8个来源共17个药材样本的葛属植物的总黄酮X1、葛根素X2、大豆苷X3、大豆苷元X4、3’甲氧基葛根素X5及多糖X6,6
6、个化学成分进行了测定[6],并测定了相应的抗内毒素活性强度,按照
此文档下载收益归作者所有