基于cfn家庭医生问答系统设计

基于cfn家庭医生问答系统设计

ID:5248521

大小:31.00 KB

页数:9页

时间:2017-12-07

基于cfn家庭医生问答系统设计_第1页
基于cfn家庭医生问答系统设计_第2页
基于cfn家庭医生问答系统设计_第3页
基于cfn家庭医生问答系统设计_第4页
基于cfn家庭医生问答系统设计_第5页
资源描述:

《基于cfn家庭医生问答系统设计》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于CFN家庭医生问答系统设计  作者简介:徐启菊(1987—),女,汉族,山东临沂市人,学生,管理学硕士,单位:安徽理工大学经济管理学院,研究方向:信息管理与电子商务。摘要:本文基于自然语义的处理的研究,借用汉语框架网(ChineseFrameNet,简称CFN)结构,采用本体描述语言构建医疗语义框架知识库,并利用事实问句来检验系统的可行性。系统使用本体编辑工具Protégé编码,实验证实方法是有效的。关键词:语义信息处理;汉语框架网;问答系统1.引言目前关于医疗行业问题的问答和搜索,问题的回答的正确率和准确率都很低,他们大多基于主题分类[1-2]或关键字匹配技术,究其因主要是用户问答的方

2、式传递给搜索引擎,搜索引擎没有能够用户自然语义的处理部分,限制了计算机在检索中的自动分析能力。基于这种问题,我们提出了基于CFN的自动问答智能系统。9自动问答系统是建立在本体知识领域数据库基础上实现的。本体(本体事物)是人类通过哲学思想认识活动从混沌自然中发现、界定、彰显和产生出来的。1993年,Gruber[2]给出定义,即“本体是概念模型的形式化规范说明”,是为了获取、描述和相关领域的知识的表示。W3C力推的本体描述语言-本体的描述语言OWL[3],具有良好的逻辑推理能力和语义表达能力。本文借助语义框架学,研究构建了基于医疗领域的汉语框架网(简称CFN)[5],以伯克利FrameNet提

3、供的数据为参照,以真实语料为支持,由框架库、句子库和词元库三部分组成,为实现个性化的Web服务、智能化以及语义Web中的语义知识共享提供基础资源[5]。本文第一步接收用户的问题、对问题进行语义分析、建立问句向量、在本体知识库中抽取答案、最后答案的处理模块对答案进行过滤和优化等一些列环节等环节建立医疗QA信息系统。将家庭医生问答系统设计为可以理解自然语言问答的自动问答系统。通过实验证明,将医疗领域医用汉语框架网络是真实可行!2.汉语框架网(CFN)汉语框架网,以加州大学伯克利的FrameNet[6]为参照,是一个以Fillmore的框架语义学[7-8]为理论基础,以汉语真实语料为依据的计算机可

4、使用的汉语词汇语义知识库。3.医疗信息本体的构建9在本体构建中我们主要选取医学的疾病信息进行建模,选取了10种有代表性的医疗疾病。为它们构建了医疗领域汉语框架知识库。基于疾病语料库,根据医疗中的要素即病症、治疗方法、预防、病因、患病人群、注意事项,抽取文档的医学术语,并进行了医疗行业本体模型的初步构建。构建医疗本体模型参照了《中华人民共和国药品管理法》、《中国分类主题词表》等有关标准。实验系统对本体模型的编码和本体编辑工具Protégé是采用了OWLLite进行的。在辅助建模阶段,在检查一致性、推理出新的分类体系时,RacerPro推理机[7]起到很大的作用。4.系统构架经过业务流程分析和功

5、能需求分析,家庭医生智能问答系统划分为以下主要模块包括:预处理模块,问句匹配,答案抽取及答案处理模块。1.提交问题:主要用于用户问题的输入;2.预处理:初次处理用户提出的问题;3.问句匹配:为了让计算机更好地语义理解,我们建立医疗领域中的专业医疗词汇对应的口语词汇词典;4.语义知识推理:利用医疗领域知识库中的A-Box、T-Box进行相关语义知识的推理,入口转化生成的RDF三元组问句向量,也就是对答案进行抽取处理;5.答案的处理:进行相关度排序和答案的抽取。然后把查询结果递交给服务器,然后将处理好的结果传递给用户。5.问题分类9问答系统中一个重要的组成部分就是问题分类。针对医疗领域,本文利用

6、多角度分类形式,为了更好的分析和回答问句,利用本体的思想,基于TREC[12]分类,对问题分类。6.本体三元组和汉语框架语义角色标注6.1汉语框架语义角色标注汉语框架网标注分层为:框架元素,短语类型标注,句法功能标注。6.2基于CFN的问句分析本文选用了医疗领域本体知识库中的5个本体框架,分别为:“患病”、“概念”、“发作”、“治疗”、“存在”,对动词进行同义扩展,利用框架中的词元,对问句进行分析。特指疑问句的分析主要是由前四个框架来完成。“存在”框架主要用于完成对非疑问句的分析。表2即为医疗领域CFN语义标注表。6.3本体三元组的抽取第一步是获取语义谓词,主要从问句的动词进行分析获取,并进

7、一步比较其与本体库中的条目关系,选取合适的语义谓词。例句:“长期患有胃痉挛的人平时应该怎么做好预防?”其CFN标注为:长期/d患/v有/v胃痉挛/n的/u人/n怎么/r预防/v9好/a?通过标注得到框架为疾病的预防框架,获得疾病名,能够让计算机准确识别问句类型通过本体思想的结合的方法、多角度的问题分类。汉语框架网语义标注可以提供具有语义的重要信息,加快了三元组的抽取时间,提高了问题类型识别效率。7.用户询问类

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。