欢迎来到天天文库
浏览记录
ID:35176179
大小:5.78 MB
页数:65页
时间:2019-03-20
《基于领域本体的生物医学文献挖掘算法研究及其系统实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、si窜麵pUP嗎。;画BEIJIVERSITYBINGJIAOTONGUNj^j^胃顧i专业学位论文基于领域本体的生物医学文献挖掘算法研究及其系统实现JI顯杨开欣学科专业软化程‘.!指导教师张红延副教授,培养院系软件学院亡三:溫I.Immm..—l…遲*.置否。^1二零_六年六月F塞^邏圓硕±专业学位论文基于领域本体的生物医学文献挖掘算法研究及其系统实现DomainOntoloBasedTextMiningA
2、lgori化mResearchofgy*化mBiomedicalLiteratuiesandSysDesign作者;杨开欣导师:张红延北京交通大学2016年6月学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可W将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编W供査阅和借阅。同意学校向国家有关部口或机构送交论文的复印件和磁盘。学校可レッ为存在馆
3、际合作关系的兄弟商校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:本卽导师签名:/签字日期;年屯月8日签字日期:《?饼4年6月&日密级:公巧1巧校代巧:0004北京交通大学硕±专业学位论文基于领域本体的生物医学文献挖掘算法研究及其系统实现DomainOntoloBasedTextMiningAlorithmResearchofgygBiome山calLiteraturesandSstemDesign
4、y14126164;作者姓名;杨开欣学号;导师姓名:张红延职称副教授工程硕±专业领域:软件工程学位级别:硕±北京交通大学2016年6月i致谢两年的研巧生生涯即将结束一,我的学生生涯也要告段落,伴随着企业实习和应聘阶段的到来:,更是我们要奉献和回报社会的时刻。在此论文完成之际首先,要感谢我的导师张红延,感谢她两年内精也的培养W及教育。从论文的选题、研巧方向上的把握、模型理论方面的指导到论文内容细节的敲定张老师都给予我极大的指导。张老师严谨的治学态度,精益求
5、精的科研精神,髙尚的工作作风,都将使我受益终身。其次,还要感谢研巧院的孙老师在我实习阶段给予实验条件[^及生物理论方面的帮助。她们富有耐必。,善于鼓励培养和挖掘学生的潜能最后,特别要感谢的是我的亲人,我能顺利的完成硕±学业,都离不开他们的关爱和支持。对于他们的辛苦付出和默默耕拉,在此由衷的表示感谢。两年时光飞逝,在北京交通大学的求学经历极大的拓宽了我的人生视野,让我见识到外面更广阔的世界。在毕业离校之际,对导师、同学、亲人、朋友献上!最真诚的的敬意,谢谢你们ii北京交通
6、大学硕七专业学位论文摘要随着生物技术的迅速发展,生物医学文献资源正レッ指数速度増长。MEDLINE/PubMed作为世界上公认的最具权威的生物医学文献数据库,收录了超过2000万条对应目录。面对如此大规模的文献资源,如果仅仅^斗手动方式查询跟踪相应主题领域信息是相当困难的。因此,对生物医学文献进行文本挖掘,从海量的文献中提取相关知识一,已经成为近年来研巧的热点之。本文生化网络为一,些关键技术进行了研巧主题并结合公司实际项目对生物医学文献挖掘中的,主要的工作结果如下:1、针
7、对于传统检索人工筛选生物医学文献中耗时巨大、筛选不完全等不足之处,根据传统机器学习模型支持向量机(SupportVectorMachine,SVM)分类模型,结合领域本体论(包括基因本体,疾病本体等),提出了针对于生物医学文献的特定领域改进的SVM算法。实验证明,该算法相对比传统的SVM分类算法拥有较髙的综合指数F1值达77.23%。2、针对在生物医学文献中挖掘复杂临床表型(病人病症表现)与致病基因关一匹配的不足之处联需要手动逐,提出了基于标准人类表型本体(HumanPheno
8、typeOntology,HPO)的临床表型与致病基因自动匹配算法。实验证明,该算法拥有较快的运行时间(5分钟处理216个样本匹配)和较高的效率。3、结合现有的生物医学领域文本挖掘工具和W上机器学习等相关算法给出综合性的系统集成方案。该集成系统基于J2EE构架,具有较强的健壮性、可移植性和稳定性。本文针对生物医学文献检索结果进行分类筛选、疾病表型与致病基因间的关联关系进行
此文档下载收益归作者所有