欢迎来到天天文库
浏览记录
ID:20589129
大小:2.66 MB
页数:98页
时间:2018-10-13
《基于知识图谱的医疗知识搜索研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Zhe-jiangSciTechUniversity硕士学位论文M’astersThesis_中文论文题目:基于知识图谱的医疗知识搜索研究英文论文题目:Researchofthemedicalknowledgebasedonknowlederaggph学科专业:管理科学与工程作者姓名:nm论文编号:祝锡永教授递交日期:2017年11月浙江理工大学硕士学位论文摘要互联网信息的爆发式增长,既为用户带来了丰富的信息知识,也为用户从中筛选所需
2、知识造成了困难。传统的搜索引擎基于对互联网数据的全文索引,通过关键词匹配索引的方式为用户返回相关信息的链接,而不是直接明确的知识点,用户仍需从返回的大量冗余链接中查找并提炼自己所需的知识。如何从海量的、结构多样化的信息中有针对的为用户返回精确信息,已成为当前知识搜索的研究热点。知识图谱技术的兴起为该研究提供了新的解决思路。知识图谱能够以一种更直观的方式表达出现实世界中的实体的信息以及实体和概念之间的关联。本文将互联网文本数据作为语料资源,对其进行知识图谱构建的研究。本文研究了知识图谱构建中的序列标
3、注问题。在该问题上,本文采用了长短期记忆(LSTM)网络结构,为保留训练过程中更多的特征信息,提出用预训练词向量和微调词向量扩展LSTM结构单元的D-LSTM模型。此外,为了应对医疗领域标注文本稀疏的情况,本文在D-LSTM的基础上结合Co-training半监督的方法,提出改进模型CTD-BLSTM,通过迭代训练进一步提升识别效率。本文用Python编写了CTD-BLSTM算法,并设置本文模型与原始BLSTM的对比实验以及用完整数据集训练的对比实验,验证了本文方法具有更好的识别效果和适应性。最后
4、,以此为基础实现了中文医疗领域知识图谱的构建。本文基于构建的中文医疗领域知识图谱,用Java语言设计实现了医疗知识搜索系统。该系统通过对用户输入的自然语言进行句法分析和语义依存分析等处理,识别用户的搜索意图,借助知识图谱,以一种更加直观、精确的方式返回用户所需的知识。关键词:知识图谱;序列标注;医疗知识搜索;半监督;I浙江理工大学硕士学位论文AbstractTheexplosivegrowthofInternetinformationnotonlybringsawealthofinformatio
5、nknowledgetousers,butalsomakesitdifficultforuserstoscreentherequiredknowledge.TraditionalsearchenginesontheInternetfull-textindexdatabasedonkeywordmatchingindexthroughthewayforuserstoreturnlinkstorelatedinformation,ratherthanexplicitknowledge,userssti
6、llneedtosearchfromalargenumberofredundantlinksreturnedandrefinetheirownknowledgerequired.Howtoprovideaccurateinformationforusersfrommassiveandstructuredinformationhasbecomeahotresearchtopicincurrentknowledgesearch.Theemergenceofknowledgegraphtechnolog
7、yprovidesanewsolutionforthestudy.Knowledgemapscanexpresstheinformationofentitiesintherealworldandtheassociationbetweenentitiesandconceptsinamoreintuitiveway.ThispapertakestheInternettextdataasthecorpusresource,andstudiesthenamedentityrecognition.Thisp
8、aperstudiestheproblemofsequenceannotationintheconstructionofknowledgemap.Inthispaper,weusethelongandshorttermmemory(LSTM)networkstructure,inordertoretainmorefeatureinformationintrainingprocess,weproposeaD-LSTMmodelusingpretrainingwordvectorand
此文档下载收益归作者所有