snp定位的一种降维及变量选择方法

snp定位的一种降维及变量选择方法

ID:33289476

大小:1.11 MB

页数:42页

时间:2019-02-23

snp定位的一种降维及变量选择方法_第1页
snp定位的一种降维及变量选择方法_第2页
snp定位的一种降维及变量选择方法_第3页
snp定位的一种降维及变量选择方法_第4页
snp定位的一种降维及变量选择方法_第5页
资源描述:

《snp定位的一种降维及变量选择方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学硕士学位论又SNP定位的一种降维及变量选择方法~—J一●l、作者姓名:学科专业:导师姓名:完成时间:李瑞概率论与数理统计崔文泉副教授二零一一年四月一夸一一,牛四月rlt’1£‘一j‘UniversityofScienceandTechnologyofChinaAdissertationforMaster’SdegreeAnapproachtodimensionreductionandvariableselectionforSNPmappingAuthor’SName:RuiLiSpeciality:Probability&Mathem

2、aticalStatisticsSupervisor:Prof.WenquanCuiFinishedTime:April201\中国科学技术大学学位论文原创性和授权使用声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特另tJDH以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论

3、文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。日公开口保密(——年)作者签名:蕉璋签字日期:趔L占:丕导师签名:签字日期:摘要人类拥有46条染色体,每条染色体由载有人类遗传信息的DNA和蛋白质构成。由于DNA是双螺旋结构,且每个DNA又由4种不同的碱基构成,而这些碱基的数目众多,称那些出现变异的碱基对为单核苷酸多态性(SNP),人类大约拥有30万的SNP标记,但是在现实研究中,可

4、以用剑的样本人数往往只有白.人左右,而真正的致病的SNP也只有数个,如何从数万到几十万个SNPs中选出真正的致病的位点,是一个典型的满足稀疏性的高维数据变量选择的问题。本文主要研究高维数据的降维问题,即“小n大P”问题,传统的变量选择方法往往都是适用于“大n小P”的情况,对于“dxn大P”问题往往不能使用。这就需要先进行降维处理,然后才能使用传统的选择方法。本文中我们提出一种新的变量筛选方法一动态分割法,同时介绍两种改进的BIC准则:EBIC及EDC准则,并将其运用到变量选择中。引入衡量变量选择优良性的准则FDR和PSR,针对所提出的算法进行数据模拟

5、,比较算法的优劣,同时比较EBIC、EDC、BIC准则选择的优劣。关键词:高维数据,动态分割,EBIC,EDC,SNP,FDR,PSR●IABSTRACT——_———————————-—————_———————————-—————————————————————一Humanhave46chromosomes,eachchromosomeiscomposedbyproteinandDNAwhichcontainedgeneticinformation.SinceDNAisadoublehelix,andeachDNAiscomposedbyfourdi

6、fferentbases.Thenumberofthebasesareveryhuge,thosevariationsinthebasesaresinglenucleotidepolymorphisms(SNPs),Humanhavealmost300thousandSNPs,butinstatisticresearch,thenumberofpeopleWecanuseareverylittle,yetthenumberofcausalSNPsareverylittle.howtoselectthecausalSNPisavariableselec

7、tionquestionwhichsatisfysparseness.Wediscussthehighdimensionaldatainthispapehwhichhavesmallsamplesizeandhighdimension.Classicalvariableselectionaleusuallyusedinthesituationof’’largensmallP”,thosecriterioncouldn’tdirectlyusedinthesituationof,,smallnlargeP”.SoweneedtOreducethedim

8、ensionofthemodel,thenwecouldusethesecriterion.Inthispa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。