欢迎来到天天文库
浏览记录
ID:42267764
大小:682.62 KB
页数:27页
时间:2019-09-09
《具有遗传性疾病和性状的遗传位点分析研究讨论》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、具有遗传性疾病和性状的遗传位点分析摘要:人体的每条染色体携带一个DNA分子,且人的遗传密码由人体中的DNA分子携带。DNA是由分别带有A,T,C,G四种碱基的脱氧核苷酸链接组成的双螺旋长链分子。在这条双螺旋的长链中,共有约30亿个碱基对,而基因则是DNA长链中有遗传效应的一些片段。在组成DNA的数量浩瀚的碱基对(或对应的脱氧核苷酸)中,有一些特定位置的单个核苷酸经常发生变异引起DNA的多态性,我们称之为位点(SingleNucleotidePolymorphism,SNPs)。染色体、基因和位点的结构关系见图1。图1.染色体、基因和位点的结构关系。大量研究表明,人体的许多表型性状差异以及对药
2、物和疾病的易感性等都可能与某些位点相关联,或和包含有多个位点的基因相关联。因此,定位与性状或疾病相关联的位点在染色体或基因中的位置,能帮助研究人员了解性状和一些疾病的遗传机理,也能使人们对致病位点加以干预,防止一些遗传病的发生。近年来,研究人员大都采用全基因组关联性分析的方法来确定致病位点或致病基因。全基因组关联性分析(Genome-WideAssociationStudy,GWAS),简单的讲,就是从人类全基因组范围内的序列变异(单核苷酸多态,SNP)中,筛选出那些与疾病性状关联的SNPs。此外,通过应用统计学原理,研究人员通过对样本的健康状况和位点编码的统计,对比分析来确定致病位点,从而
3、发现遗传病或性状的遗传机理。本题针对某遗传病提供的1000个样本信息数据,每个样本信息包含的9445个位点编码信息以及包含这些位点的基因信息数据。通过应用统计学,矩阵降维处理及数据挖掘的相关方法,来对本题所包含的四个问题进行研究以及对所得出的具体结果数据进行合理性分析。具体问题如下:问题一:将genotype.dat中每个位点的碱基(A,T,C,G)编码方式转化成数值编码方式,便于进行数据分析。问题二:设计或采用一种方法,依据相关的理论依据,通过对附录中提供的1000个样本中的可能致病的染色体片段上的9445个位点的编码信息进行筛选,判断,找出某种疾病最有可能的一个或几个致病位点。I问题三:
4、同题二中的遗传疾病A的样本信息(phenotype.txt文件)。现有300个基因,每个基因所包含的位点名称见文件夹gene_info中的300个dat文件,每个dat文件列出了对应基因所包含的位点(位点信息见文件genotype.dat)。由于可以把基因理解为若干个位点组成的集合,遗传疾病与基因的关联性可以由基因中包含的位点的全集或其子集合表现出来请找出与疾病最有可能相关的一个或几个基因,并说明理由。问题四:依据题二中的样本中的9445个位点的编码信息(见genotype.dat文件)。通过将相关的性状或疾病看成一个整体,然后来探寻与它们相关的位点或基因。依据此原理并根据multi_phe
5、nos.txt文件给出的1000个样本的10个相关联性状的信息及其9445个位点的编码信息(见genotype.dat),找出与multi_phenos.txt中10个性状有关联的位点。关键词:遗传统计学,全基因组关联性分析(GWAS),位点(SNPs)II目录目录......................................................................................................................................III1.问题重述.......................
6、.......................................................................................................11.1问题背景........................................................................................................................11.2待解决问题...........................................................
7、.........................................................12.符号说明..............................................................................................................................23.问题一..........
此文档下载收益归作者所有