面向基因的文本挖掘方法研究及其应用

面向基因的文本挖掘方法研究及其应用

ID:36808407

大小:6.10 MB

页数:66页

时间:2019-05-15

面向基因的文本挖掘方法研究及其应用_第1页
面向基因的文本挖掘方法研究及其应用_第2页
面向基因的文本挖掘方法研究及其应用_第3页
面向基因的文本挖掘方法研究及其应用_第4页
面向基因的文本挖掘方法研究及其应用_第5页
资源描述:

《面向基因的文本挖掘方法研究及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要题名:面向基因的文本挖掘方法研究及应用硕士姓名:张丹导师姓名:孙啸学校名称:东南大学近年来关于基因功能、基因和疾病关系的生物医学文献大量涌现,但因其数量之多、涉及范围之广,很难靠人力完成全部的阅读来发现其中丰富的生物学知识。同时,从事基因疾病课题的研究人员,要通过大量的实验和临床数据分析才能得到出课题结论或预测,研究周期长,人力物力投入大,而且每研究一种新基因或新疾病就要重复实验过程,知识发现过程缓慢。为了能够充分利用已有的研究成果,节省人力物力,需要将文本中的生物学知识抽取出来提供给研究人员,帮助他们快速了解基因或疾病,加快相关研究的进展。

2、我们开发的基因疾病关系数据库系统,利用生物医学文本挖掘工具,从系统自动下载的生物医学文摘中抽取基因、疾病、基因本体等信息实体及其相互关系,将这些数据存储到数据库中,把非结构化的文本数据转化为可检索的结构化数据。系统提供基因、疾病、基因本体等生物学实体关联信息的检索,以及关联信息原文原句的查询,使用户全面了解感兴趣的基因或疾病,帮助用户加速相关学科的研究。此外,系统具有可视化的串联检索功能,能够利用数据库中已有的生物学实体关系,对潜在的生物学实体关系进行深度挖掘,分析出新的生物学实体关联信息,为用户相关研究的进展提供帮助。基因疾病关系数据库已存储了本体

3、信息约330万条,2000.2003年基因疾病相关的文摘约10万篇,其中经过文本挖掘处理的文摘约10000篇,生物学实体关联信息约12000条,数据仍在不断增加中。经测试,系统具有良好的生物学实体关联性,能够发现潜在的基因、疾病、基因本体相互作用网络,挖掘出新的生物学实体关系,辅助形成生物科学研究创新假设。关键词:文本挖掘,基因,生物医学本体,数据库东南人学硕.1:学位论文THESISTITLE:AbstractLiterature-miningandtheapplicationforgeneknowledgediscoveryMASTERNAME:

4、ZHANGDanSUPERVISORNAME:SUNXiaoSCHOOLNAME:SoutheastUniversityMotivation:AsknowntoUS.withtheexponentialincreaseinbiomedicalliteraturesaboutgenesfunctionandtherelationshipsamonggenesanddiseases,it’Sdifficultforscientiststokeepuptodatewithongoingresearchtoobtaintheabundantbiologica

5、lknowledgemanually.Meanwhile,toconcludeandforecasttherelationshipsamonggenesanddiseases,researchershavetomakecountlessexperimentsandanalyzeagreatlotclinicdata,whichcostsmuchtime,manpowerandmaterialresources.Moreover,peoplehavetorepeattheexperimentsandanalysisiftheyplantostudyaf

6、reshgeneordisease.Inordertotakefulladvantageofstudyfruitsandsavemanpowetandmaterialresources,itisnecessarytoprovidetheresearcherswiththebiologicalknowledgeextractedfromtheliteratures,whichwillassistthemtOknowthegenesordiseasesquicklyandimprovetheresearchdevelopment.Method:Makin

7、guseofthebiomedicalliteraturesminingt001.wedevelopedGene.DiseaseRelationshipMinersystem,whichcouldtranslateunstructuredtextdataintostructureddatabydownloadingthebiomedicalliteraturesautomatically,extractingthebiomedicalentitiesandtheirrelevantrelationshipsfromtheliteratures,and

8、finallystoringtheresultsinthedatabase.Wedesignedafrien

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。