支持向量机方法在伤寒论方分类建模中的应用

支持向量机方法在伤寒论方分类建模中的应用

ID:36630046

大小:66.19 KB

页数:9页

时间:2019-05-13

支持向量机方法在伤寒论方分类建模中的应用_第1页
支持向量机方法在伤寒论方分类建模中的应用_第2页
支持向量机方法在伤寒论方分类建模中的应用_第3页
支持向量机方法在伤寒论方分类建模中的应用_第4页
支持向量机方法在伤寒论方分类建模中的应用_第5页
资源描述:

《支持向量机方法在伤寒论方分类建模中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、支持向量机方法在《伤寒论》方分类建模中的应用作者:孙燕,臧传新,任廷革,李宇航【关键词】支持向量机;分类;《伤寒论》支持向量机(SuportVectorMachine,SVM)方法是20世纪90年代出现的一种新的分类方法,已初步表现出很多优于已有方法的性能。有人把SVM方法与其他16种已有的方法作了系统的比较,得出SVM方法最优的结论[1]。利用支持向量机方法训练得到的分类器具有很好的推广能力,即使训练样本很少,分类器的预测准确率也会很高。  1支持向量机方法SVM方法是建立在V.N.Vapnik等人提出的统计学习理论(StatisticalLea

2、rningTheory)[2-3]基础上的一种新型学习方法,是对结构风险最小化原理的近似。它是统计学习理论中最年轻也最实用的部分,在很多领域得到了成功应用,如人脸检测[4]、文本分类[5]、气象预报[6]、分子生物学中的基因分类[7]等。9SVM分类器的基本原理是使用一个非线性变换,将不可分的空间映射到一个高维的线性可分的空间,并建立一个具有极小VC维数的分类器,该分类器仅由大量样本中的极少量支持向量确定,且具有最大的边界宽度。支持向量机算法的技巧在于不直接计算复杂的非线性变换,而是计算非线性变换的点积,即核函数,从而大大简化了计算的过程。因此,统

3、计学习理论和SVM方法建立了一套较好的有限样本下机器学习的理论框架和通用方法,有严格的理论基础,其核心思想就是学习机器的复杂性要与有限的训练样本相适用,能较好地解决有限样本、非线性、高维数和局部极小点等实际问题,能建立稳定的预测准确率高的分类器,所以适用于分类模式识别。  2SVM方法在《伤寒论》方分类识别中的应用  自《伤寒论》问世以来,研究伤寒的著作有千余种,涉及七百余医家。尤其在明清时期,各医家在孙思邈“方证同条,比类相附”的启发下,运用归类编次的研究方法,从不同的角度充分揭示了《伤寒论》辨证论治的规律,如按方类证、按法分类、按症类证、按因类

4、证、分经审证等等[8],大大丰富和发展了《伤寒论》的内容。9  以上都是医家们人为的分类方法,现在我们利用模式识别的方法从不同的角度、不同的侧面、不同的层次对《伤寒论》方进行分类训练建模,来尝试对张仲景制方规律和辨证论治规律的机器学习建模,不仅可以用更便于现代人理解的形式再现仲景的思维模式,使中医学的继承和学习更加有效,还可以发现一些隐含的知识,供我们学习借鉴。  2.1数据采集数据来源于刘渡舟主编的《伤寒论校注》,选择原文中带有方药的条文,将其转换为电子文档并进行预处理后,利用数据库技术导入专门用于“解析”和“标引”的“中医方剂数据库”[9]。 

5、 2.2数据一致化处理  由于计算机难以识别不遵循一定模式的数据,不同的表达则认为是不同的知识,而中医学中对同一个药名、药物功效、方名、症状、证候等数据有多种不同的表述方式的现象非常普遍,因此需要对其进行一致化、规范化处理,去除大量数据的噪音影响,保证所得数据具有较好的可信度,所得的结果才能反映真实的规律。  数据预处理是利用“解析”和“标引”技术,对采集到的《伤寒论》方剂数据进行处理的过程。所谓“解析”,实质上就是将文献数据结构化、规范化的过程。我们在“中医方剂数据库”9对一个方剂解析后的字段可达171个,其中22个大项,149个子项。主要包括文

6、献位置(书、卷、页、序)、方名、别名、主治病证、方剂组成、方剂功效、制剂工艺、剂型、服用方法、使用禁忌、加减用法、辅助疗法、反应与疗效、病机分析等。所谓“标引”,即中医学主题词标引,就是用给定的《中医学主题词表》中的词条,对解析好的数据内容冠以恰当的标识,从而使文献数据标准化、规范化,其目标是把文字媒体的信息解析后并分门别类的加以标识。这样的工作是在一种叫做“文献解析工作单”的电子表格上进行的,这是一项十分繁重的、专业性很强的的工作,但是很重要,因为信息解析是整个信息活动的基础,为在大型数据库上进行数据挖掘提供良好的土壤。  2.3《伤寒论》方剂功

7、效的宏观量化处理  SVM方法是完全基于数据的方法,为了与国际通行的软件兼容,笔者采用与SVMLight类似的数据文件格式[10]。因此必须对《伤寒论》方剂功效进行定性定量处理,这也是进行分类训练建模的基础条件。  经过一致化处理后,有关方剂的主要因子,诸如方剂的药物组成及其临床表现症状和体征等数据就可以导入“中医方剂分析系统”9。通过利用近似推理技术实现了方剂有关因子的宏观量化,把定性的语言描述转化为定量的数字表达,提供量值变化的信息提示,可直观、动态地了解方剂组成变化的过程及其影响因素;同时使得每一个方剂因子之间具有了可比性,实现了定性定量的层

8、次,这是目前任何方剂系统都无法做到的。  中医学中存在“异病同治”的问题,同一个方剂可以治疗不同的疾病和证候,但究竟是方剂

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。