基于本体的中医文献诊疗信息的智能检索示范研究

基于本体的中医文献诊疗信息的智能检索示范研究

ID:33746489

大小:13.98 MB

页数:146页

时间:2019-02-28

基于本体的中医文献诊疗信息的智能检索示范研究_第1页
基于本体的中医文献诊疗信息的智能检索示范研究_第2页
基于本体的中医文献诊疗信息的智能检索示范研究_第3页
基于本体的中医文献诊疗信息的智能检索示范研究_第4页
基于本体的中医文献诊疗信息的智能检索示范研究_第5页
资源描述:

《基于本体的中医文献诊疗信息的智能检索示范研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文摘要基于本体的中医文献诊疗信息的智能检索示范研究现代中医临床诊疗研究开始重视从以往的研究和治疗经验得到论证和指导,期刊文献更新快,文献数量大,论文内容具有较高的学术价值、比较注意新的趋势和发展等优点,因此,对中医临床文献进行有效的检索至关重要。本研究旨在设计一个基于中医文献信息本体的智能检索模型,能够借助当前最新的语义网知识进行本体层次的设计和本体概念的研究,从而使检索模型具备基本的推理能力,提高查全率和查准率,能将输出结果按照相关性排序并进行统计,从检索到的批量文献中总结、发现和掌握所查专题内容的整体发展状况和遣方用药规律。1.

2、研究背景现有的中医文献数据库大多是针对文献外部特征信息建立的,中医临床研究人员很难从检索到的批量文献中掌握所查专题内容的整体发展状况。传统的检索方式主要通过关键词、关键词串或者主题词来进行全文检索,用户很难表达其真正的检索意图,也很难从检索结果提供的大量文献中提取共性的规律。由于检索过程机械,不理解语义。导致一方面。检索结果中包含大量无关信息。另一方面,很多与关键词同义的信息却没能检索出来。其次,大量同领域或者相关领域的数据存储库往往使用不同的标识制度,不兼容的术语和不同的数据格式。目前中医药信息主要以自然描述为主,缺乏知识层次的科学

3、表达,没有统一的术语定义,给数据的集成和共享造成了一定的困难。2.研究内容本研究以中医临床文献中的诊疗研究内容为对象,利用本体建设来实现中医文献信息的智能检索。本研究的研究过程主要包括确定研究目标、需求调研、数据采集、数据处理、建立本体、智能检索模型的设计和相关性排序算法、中医临床文献的智能检索模型、系统检索测试等八个部分。2.1确定研究目标本研究根据中医医生在临床实际研究中对于文献中所涉及的内容的检索需求,通过部分中医临床文献内容的语义分析和本体建设,实现基于中医临床文献信息的中医智能检索,提高查全率、查准率和输出结果相关性排序。能

4、将输出结中国中医科学院二oo九级博士研究生学位论文果按照相关性排序并进行统计,从检索到的批量文献中总结、发现和掌握所查专题内容的整体发展状况和遣方用药规律。2.2需求调查2.2.1对中医临床文献内容的调研为了基本了解中医临床文献内部诊疗信息中各项信息出现频率以及之间的关系。总结文献中可以为中医临床诊疗研究提供的检索服务的支撑信息。选取中医核心期刊排名前几名的期刊,对其所刊登的2006.2007年度的关于中医临床诊疗研究的文献进行文献诊疗过程中理、法、方、药等信息记录的调研,发现临床作者诊疗研究的各种具体方向,并抽样调查部分文献中体现的

5、具体数据需求。2.2.2对中医临床医生和科研人员检索需求的调研为了真正实现基于中医临床文献提供临床诊疗研究需求的检索服务,以调查问卷的形式进行小规模的调查,调查对象为三级甲等医院中的初、中、高级临床医师,共回收有效问卷200份。总结中医临床医生在诊疗研究过程中对文献信息检索的具体需求。经统计分析后,认为临床医师的检索需求重点停留在病、证、症及方剂和针灸疗法上,并且总结确定了一些常用检索式。2.3数据采集本研究的目的是实现中医临床文献信息的智能检索,而智能检索之前必须先确定用户的检索需求和检索的方式、对象,建立检索对象的本体,确定各个体

6、之间的语义关联关系。资源库是检索的最基础的设施,是实现智能检索的最基本的保障,要保证资源库中有充足的可供检索的信息。2.3.1资源库本研究选择了中国中医科学院中医药信息研究所研制的中医疾病临床研究数据库和中药药理实验数据库。2.3.2年代’由于资源库中共收录1988年至今的中医临床文献二十七万余篇,数据量庞大,选择基本已经加工完成且年代相对靠近的2005.2007年发表于期刊中的中医临床文献中所涉及的诊疗内容。2.3.3原则临床文献篇数比较多的疾病。所研究的对象一定要有一定的文献量,能展现所选年度内的临床研究热点和多发疾病的诊疗情况。

7、6基于本体的中医文献诊疗信息的智能检索示范研究2.3.4内容选取诊疗研究过程中涉及的疾病、证候、症状、治则、方剂、中药、穴位、药理分类等内容。2.4数据处理本研究将实施的本体建设和智能检索将基于已有的资源库进行,因此要对资源库中的数据进行数据清洗和规范整理。2.4.1参考标准数据处理必须遵循一定的原则,本研究选取美国国立医学图书馆研制的Mesh主题词表和中国中医研究院中医药信息研究所编制的中医药学主题词表为最基本的词表,并选取部分国标、《中华人民共和国药典》、《中药大辞典》等等作为词表的补充。2.4.2规范流程首先将各字段内容与标准词

8、表中的正名进行匹配,匹配失败的词语与异名进行匹配,仍然无法与异名匹配的词语将纳入相似度计算范围,与词表中的正异名分别用Jaccard公式进行相似度计算。根据计算结果,结合人为分析,进行初步的词语规范。由于各字段的采集状况

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。