基于中文自然语言的合理用药查询

基于中文自然语言的合理用药查询

ID:34850239

大小:1.43 MB

页数:38页

时间:2019-03-12

基于中文自然语言的合理用药查询_第1页
基于中文自然语言的合理用药查询_第2页
基于中文自然语言的合理用药查询_第3页
基于中文自然语言的合理用药查询_第4页
基于中文自然语言的合理用药查询_第5页
资源描述:

《基于中文自然语言的合理用药查询》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第1V页武汉科技大学硕士学位论文4.1.1中文药品词库转换器⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯284.1.2Jcseg分词结果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.294.2三元组构建器实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯304.2.1构建语义节点知识库⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯304.2.2语义映射知识库构建⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.314.2.3语义结构分析器⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.324.2.4三元组构建和SPARQL生成⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯334.3本章小结⋯⋯

2、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯35第五章总结与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..365.1工作总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯365.2展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯36参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯38致谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41附录A攻读学位期间发表的论文⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..42武汉科技大学硕士学位论文第1页1.1问题提出的背景及意义第一章绪

3、论目前,医疗系统中对于用户输入的查询语句,传统的检索方法是对语句进行简单分词,然后将切分后的词语作为关键词在数据库中和文档中检索结果。这种方法处理比较简单,但是不能充分理解用户搜索意图,甚至会偏离用户的搜索初衷,得到大量冗余的或者错误的搜索结果集。单纯的文本匹配会丢失检索语句的原始结构信息和由此延伸的语义信息,检索得到的结果往往是比较宽泛甚至是偏离用户原本搜索意图的,给用户带来了人工筛选结果的额外工作。比如当用户输入“治疗胃病的抗生素”,如果做单纯关键词的匹配搜索,会得到有关胃病和抗生素的大量结果。结果集中虽然可能包含用户需要的信息,但是冗余的结果集同样是很庞大的,

4、用户需要花费更多的时间选取结果。而对于医疗系统的用户而言,他们缺乏计算机领域专业知识,不能完成结构化的语义查询【lJ语句,用户更习惯输入带有一定语义的自然语句。因此,深入挖掘用户输入语句的语义,提供良好的检索接口,将结构化查询透明化变得意义重大。国外有一些针对巨型知识库的i'口-J题回答系统,如Dbpedia[2】等。但是国内暂时还没有比较成熟的针对医疗领域的中文自然语言问题回答系统【3】。本文参考其他的问题回答系统,结合现有的药品知识库,针对中文自然语句进行转换,将受控的中文搜索语句转换成SPARQL查询,对用户输入的请求进行语义检索。提出了在医疗领域加入对搜索语

5、句的语义化理解,通过分析和处理用户输入的自然语句,充分挖掘用户搜索意图并将其转换为系统可以理解并执行的SPARQL【4】查询语句,从而使用户获取更加准确的搜索结果集。基于中文自然语言合理化查询技术的实现主要依赖以下技术:(1)中文自然语言的分词处理技术中文分词垆】是将一系列的汉字通过一定的标准划分为不同的汉字组合,而这些汉字组合即称为词。中文自然语句的特殊性表现在词语之间没有分隔符的存在,因此导致对于中文语义处理时需要将其先做分词处理。常用的中文分词算法有字符串匹配分词法、理解分词法和统计分词法。中文分词的算法选择并非唯一确定的,根据实际环境和需求有时对算法进行复合

6、选用,以获取较为理想的分词结果。(2)句法分析技术句法分析[6】是自然语言处理的核心技术。句法分析根据语句的语法体系,通过计算构第2页武汉科技大学硕士学位论文造出句子的语法结构,并将其转换成树形结构,以语法树的形式描述各个语法单元之间的关系。句法分析分为基于规则的分析和基于统计的分析,前者依据自然语言的规则来进行分析更加接近自然语言的语义理解,后者通过统计学的概率计算。(3)生物医学与语义技术将语义技术应用于医学领域时,针对不同的应用目标和实施阶段,分别有不同的应用方法,即医学实体标识【71、医学知识描述[71、医学知识组织‘71、医学语义互操作【71、医学知识推理

7、【¨、医学知识共享与发布【7】。(4)语义检索技术语义检索技术【_7】是在检索过程中引入语义化处理,对语义处理后的检索条件进行检索。语义检索的核心是充分理解检索语句的语义,从自然人或接近自然人语言的角度处理检索语句,从语句的语义层次而不单纯是语句本身包含的关键字的层次上对用户的查询做语义处理。语义检索技术伴随着语义网时代的到来快速发展,在丰富的网络资源中根据分析的语义检索最适合或更适合用户需要的结果集,给用户带来更好的体验。1.2国内外研究现状Shady等人在2011年提出了基于RDF图的关键词检索模型【8J。该模型检索与关键词匹配的子图集,并根据统计语言模型对

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。