资源描述:
《利用数据挖掘方法预测中药缺失药性的初步研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、利用数据挖掘方法预测中药缺失药性的初步研究论文.freelinimumnumberofinstancesperleaf,其含义为所建立的决策树每个叶结点必须覆盖的最小实例数量,简称MNIPL,其余参数采用默认值。采用十折交叉验证优选模型参数,确定最佳模型;再以95个检验数据进一步考察所建模型的可靠性。在考察总体误差估计的同时,根据误差矩阵分析该预测模型对归经预测的灵敏度与特异性。总体误差估计计算为模型将检验集正确分类的百分比,代表模型总体分类效果;敏感度计算为模型将检验集中归肝经的实例正确分类的百分
2、比,代表预测模型的捕捉范围;而特异性计算为检验集中被预测为归肝经的实例正确分类的百分比,代表预测结果的可信度。2结果选择不同MNIPL所建立模型结果,评价参数为预测模型节点数、灵敏度、特异性和交叉验证总体误差估计。结果见表1。表1不同参数模型考察表(略)模型规模方面,模型2决策树节点数为41,模型3节点数为55,模型2比模型3更具简洁性,更符合最短描述长度原理5。综上认为模型2更具有优势。数据库中药味总数为507,其中归肝经药249味,采用随机分类的特异性为49.11%,而模型2为74.76%。利用
3、95味药的药性数据检验模型2,模型敏感性为66.00%,特异性为84.62%,总体误差为75.79%。其总体误差估计与表1相当;敏感性降低,其源于95个检验数据集偏小,归肝经实例为50个,敏感性66%与70%之间相差仅2例分类错误,应属于正常波动。选择模型2为肝经决策树预测模型,其各层节点结构见表2。表2预测模型2各层节点结构表(略)中医认为,肝主藏血、主疏泄,肝对血液的运行、气机运动、脾胃运化、情志活动等都有重要影响。《素问·至真要大论》谓:“诸风掉眩,皆属于肝”,肝与“风证”有密切关系。由表2可
4、见,各节点属性大多与肝经有关系,与中医理论相一致。其中补肝、平肝、疏肝、清肝与肝有直接关系,和血、活血、凉血、散结、散瘀与血液运行相关,解痉与“风”相关,而定惊、通经络等都与肝经有一定关系。挖掘结果也强调了这种关系。根据模型2预测2005版《中华人民共和国药典》(一部)417味归经记录缺失药结果见表3,如“天山雪莲”归肝经的概率为81.8%;沙棘归肝经的概率为100%;而藏菖蒲不归肝经的概率为80.8%。亦有文献报道,天山雪莲注射液具有较强的抑制乙型肝炎病毒复制的作用6;沙棘对于小儿急性黄疸型肝炎具
5、有较好的疗效7。表明此挖掘结果与临床使用有较好的一致性。表3缺失归经记录药预测结果表(略)3结论本研究从药物功能与药性的关系出发,利用数据挖掘技术建立了肝经归经的预测模型,为药物缺失药性的补充提供了新的思路和方法。本研究采用交叉验证法结合旁置验证法考察模型。507个数据并不是十分充足,为解决训练集与检验集之间数量的矛盾,采用得到普遍认可的十折交叉验证法5;同时,随机分离部分数据,采用旁置法验证模型,进一步确保了模型的可靠性。中医药是复杂体系,须从复杂性科学的角度认识中药,从多环节、多因素开展研究8。
6、本研究得出的模型正是中医药一些局部规律性的体现,其预测结果并非已经确立药物的归经,而是为药物在临床中归经的最终确立提供了重要参考信息,也为药物归经研究提供了重要支持。【