从人类基因组变异的地

从人类基因组变异的地

ID:29661445

大小:201.50 KB

页数:75页

时间:2018-12-21

从人类基因组变异的地_第1页
从人类基因组变异的地_第2页
从人类基因组变异的地_第3页
从人类基因组变异的地_第4页
从人类基因组变异的地_第5页
资源描述:

《从人类基因组变异的地》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、从人类基因组变异的地图人口大规模测序千人基因组计划联合体*千人基因组计划的目的是提供了深刻的表征人类基因组序列变异为基础调查,基因型和表型之间的关系。在这里,我们提出了试点阶段的结果项目,旨在开发和高通量全基因组测序,比较不同的策略平台。我们进行了三个项目:低覆盖度全基因组测序的179个人从四个人群;高覆盖测序两个母亲父子三人和外显子目标的697测序个人从七个人口。我们描述的位置,等位基因频率和当地的单体型结构约15万单核苷酸多态性,100万短的插入和删除,以及20,000结构的变体,其中大部分是以前未描述。我们表明,因为我们已经编目茫茫大多数

2、常见的变化,发现任何个体的当前访问的变体中,有95%以上的是存在于该数据集。平均而言,每个人都被发现携带亏损约250至300的功能变种注明牵连的遗传紊乱的基因和50到100的变种。我们演示了如何使用这些结果可以通知协会和功能研究。我们从两个三人小组,直接估计的速率OFDEnovogermline基地替换突变约1028每碱基对每一代。我们探索方面的数据自然选择的签名,并确定附近的基因的遗传变异显着减少,由于选择链接的网站。这些方法和公共数据将支持下一阶段的人类遗传研究。了解基因型和表型之间的关系是在生物学和医学的中心目标之一。参照人类基因组序列1

3、人类研究提供了基础遗传学,但人类基因变异的系统调查需要满DNA序列变异在整个频谱中的知识等位基因频率和类型的DNA之间的差异。取得实质性进展已经作出。到2008年公开目录变异位点(dbSNP数据库129)包含约11万单核苷酸多态性(SNPs)和3万短吨插入和删除(插入缺失)2-4。数据库的结构变异(例如,dbVAR)索引的大型基因组变异的位置。国际HapMap计划的两个等位基因频率及相关编目附近的变种之间,这种现象称为联动模式不平衡(LD),横跨几个人口为350万个SNPs3,4。这些资源带动疾病基因的发现,在第一新一代的全基因组关联研究(GW

4、AS),其中在几十万的变异位点的基因型,并结合LD的知识结构,让绝大多数的普通变种(这里,那些with.5%的次要等位基因频率(MAF))测试协会4与疾病有关。在过去的5年中协会研究已经确定了一千多与疾病易感性和其他常见性状相关的基因组区域5。常见和罕见的结构变异的全基因组的集合同样进行了测试,与疾病相关6。尽管取得了这些成就,很多工作仍然需要实现深了解人类表型的遗传贡献7。一旦一个地区已确定为窝藏的风险轨迹,详细研究所有“遗传变异的轨迹是需要发现的因果变种(次),量化疾病易感性的贡献,阐明其角色功能的途径。低频和稀有变体(这里被定义为0.5%

5、至5%的MAF,低于0.5%的MAF,分别),大大超过了常见的变种,也有助于显著的遗传结构ofdisease的,但它尚未被系统研究7-9。同时,先进的DNA测序技术,使个体的测序基因组10-13,照亮的差距,在数据库的第一代主要包含常见的变异位点。一个更完整人类DNA变异的目录是充分了解的前提条件常见和低频变体在人的表型的作用的变化。千人基因组计划的目的是要发现,基因型和提供准确的所有形式的人类DNA单倍型资料在多个人群中的多态性。具体而言,目标是表征的变种,基因组区域的95%以上目前高通量测序技术,等位基因频率的1%或更高(的经典定义的多态性

6、)每5个主要的人口群体(群体或祖先来自欧洲,东亚,南亚,西非和美洲)。由于功能的等位基因,经常发现在编码地区和等位基因频率已经减少,低频率等位基因(下来,对0.1%)也将被编目等地区。在这里,我们报告的结果,该项目的试点阶段,其目的这是发展和比较不同的策略全基因组测序高通量平台。为此,我们承诺三个项目:179人的低覆盖度测序;深两个三人小组6个人测序和外显子测序8,140个外显子697人(见专栏1)。结果给我们一个多更深,更均匀的画面比人类基因变异以前,提供了新的见解到景观功能变异,遗传协会在人类和自然选择。数据生成,对齐方式和变异的发现共4.

7、9兆盐基的DNA序列中产生的9个从DNA测序中心用三个测序技术,*列出的参与者和他们的隶属关系将出现在底纸。2010年10月28日

8、VOL467

9、自然

10、1061麦克米伦出版者有限公司。保留所有权利©2010永生化淋巴母细胞系(表1,得到补充表1)。所有测序的个人提供的通知同意,并明确同意向公众传播他们的变化数据,作为人类基因组单体型图计划的一部分(见补充信息有关详细信息,知情同意和数据发布)。的异质性(读取长度从25到几百个碱基对序列数据(BP);单配对结束)反映的多样性和快速发展在项目过程中的相关技术。所有主要序列来自正确的个人数据被证实人类

11、基因组单体型图SNP基因型数据比较。不同的分析检测和基因序列变异不同类型和三个项目,但所有的工作流程共享以下四个特点。(1)发现:排列顺序读取到参考基

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。