基于数据挖掘技术的致病位点分析

基于数据挖掘技术的致病位点分析

ID:17953795

大小:1.19 MB

页数:64页

时间:2018-09-11

基于数据挖掘技术的致病位点分析_第1页
基于数据挖掘技术的致病位点分析_第2页
基于数据挖掘技术的致病位点分析_第3页
基于数据挖掘技术的致病位点分析_第4页
基于数据挖掘技术的致病位点分析_第5页
资源描述:

《基于数据挖掘技术的致病位点分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级UDC学校代码10500硕士学位论文(全日制学术学位)题目:基于数据挖掘技术的致病位点分析英文题目:AnalysisofPathogenicLociBasedonDataMiningTechnology学位申请人姓名:柯跃申请学位学科专业:计算机应用技术指导教师姓名:周俊杰二○一八年五月分类号TP391密级UDC学校代码10500硕士学位论文题目基于数据挖掘技术的致病位点分析英文题目AnalysisofPathogenicLociBasedonDataMiningTechnology研究生姓名(签名)指导教师姓名(签名)职称

2、申请学位学科名称计算机科学与技术学科代码0812论文答辩日期2018.5.15学位授予日期学院负责人(签名)评阅人姓名评阅人姓名年月日学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规

3、定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖北工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。学位论文作者签名:指导教师签名:日期:年月日日期:年月日摘要随着生命科学技术日益蓬勃,且取得了许多重大的成果,此外分子生物学的研究也是发展迅猛,由此产生的生物基因数据呈指数倍的增长,形成了海量的基因遗传数据。这么多海量数据蕴藏着大量具有重要科研价值的信息,因此挖掘出遗传疾病的致病位点对人类生命健康和疾病的预防、治疗具

4、有积极的意义。文章研究的主要目的:结合基因遗传学和计算机科学建立合理的评价模型,对基因位点数据进行分析,挖掘出隐含在基因位点数据中与疾病显著相关的位点。文章主要选取了三种不同类别的方法来对致病位点数据进行了研究:分别是统计学中的卡方检验、信息值计算以及逻辑回归分析方法;基因遗传学中的显性遗传模型方法;数据挖掘技术中的随机森林建模方法。然后对这三种不同研究方法的结果进行了分析、对比和交叉验证,接着提出了一种基于基因遗传显性模型和随机森林模型相结合的两步挖掘方法,并将其运用在位点数据集的挖掘上。经过对数据集进行实验处理和分析,并将实验结果

5、与统计学方法对比和交叉验证,以及针对实现结果对随机森林模型进行了评价和分析。表明本模型能够实现与疾病相关的致病位点检测,具有较高的准确性和有效性,且本模型比较简单易于实现,针对此类问题具有极大的普适性。最后通过对随机森林模型的研究,发现节点分裂算法会影响随机森林模型的性能。因此提出了一种基于线性函数关系的方法来优化节点分裂算法,来实现随机森林模型分类最优的目标。文中提出的优化方法就是利用线性关系将C4.5和CART这两种算法进行组合,然后重点分析和研究了综合算法在随机森林模型上的应用和对随机森林分类性能的改善程度。为了验证优化后算法的

6、分类性能,将该算法运用到不同数据集上进行实验,通过对实验结果的分析发现经过优化的算法能有效提高随机森林模型的分类性能。关键词:卡方检验,致病位点,随机森林模型,数据挖掘IAbstractWiththeboominglifesciencesandtechnology,andmanyimportantachievementshavebeenmade,theresearchonmolecularbiologyhasalsobeendevelopingrapidly.Theresultingbiologicalgenedatahasgrown

7、exponentially,resultinginavastamountofgeneticgeneticdata.Withsomuchdata,therearealotofinformationwithimportantscientificresearchvalue.Therefore,itisofpositivesignificancetodigoutthepathogenesisofgeneticdiseasestopreventandtreathumanlifeandhealth.Themainpurposeoftheartic

8、leistoestablishareasonableevaluationmodelcombininggeneticsandcomputerscience,analyzethelocusdata,andfindoutthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。