基于表型以及微阵列数据基因(型)分类技术的研究

基于表型以及微阵列数据基因(型)分类技术的研究

ID:31996962

大小:3.46 MB

页数:110页

时间:2019-01-30

基于表型以及微阵列数据基因(型)分类技术的研究_第1页
基于表型以及微阵列数据基因(型)分类技术的研究_第2页
基于表型以及微阵列数据基因(型)分类技术的研究_第3页
基于表型以及微阵列数据基因(型)分类技术的研究_第4页
基于表型以及微阵列数据基因(型)分类技术的研究_第5页
资源描述:

《基于表型以及微阵列数据基因(型)分类技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、扬州大学博士学位论文基于表型以及微阵列数据的基因(型)分类技术研究姓名:肖静申请学位级别:博士专业:作物遗传育种指导教师:徐辰武20070501肖静:基于表型以及徽阵列数据的基因(型)分类技术研究.3.基于表型以及微阵列数据的基因(型)分类技术研究中文摘要分离分析

2、主基因基因型则将是具有不同平均数和相同方差的多个正态分布的混合.因此,分离分析通过高斯混合模型的构建、参数的极大似然估计以及似然比检验统计量的计算,从而实现主基因的效应估计和各种遗传假设测验.然而,现有的分离分析方法均是基于单一性状进行的,主基因的统计功效较低.为此,本研究提出一种多性状主基因联合分析方法一多元分离分析方法(MultivariateSegregationAnalysis,MSA),MSA可以充分利用多个数量性状问的遗传相关和剩余相关信息,因此有望提高主基因的检测功效,以及削析复杂性状的遗传结构.MSA通过建

3、立多个多元高斯分布的混合模型,采用EM算法实现的极大似然估计方法进行主基因的分离比例、主基因效应和剩余变异估计,以似然比测验统计量进行主基因的各种遗传假设检验,以一因多效、独立遗传和紧密连锁3种可能模型下的贝叶斯信息准则(BayesianInformationCriterion,BIC)来区分主基因是一因多效还是紧密连锁.为了验证方法的可行性,模拟研究以F2群体为例设置了两套模拟实验,模拟实验1研究不同主基因遗传力和样本容量下MSA的统计功效、主基因效应和剩余变异估计的准确度和精确度.模拟实验2研究不同遗传力下MSA区分一

4、因多效主基因或紧密连锁主基因的能力.计算机模拟研究结果表明:(1)无论主基因是同时控制多个性状的表达,还是仅控制其中一个性状的表达,由于联合分析充分利用了性状之间的相关信息,MSA均可以显著提高主基因的被发现能力.(2)MSA可以显著增加主基因效应估计值的准确度和精确度,通常来说,只要主基因的检测功效高达50%以上,其相应估计值的准确度和精确.4-扬州大学博士学位论文度均可达到较理想水平.(3).MSA还能够有效的区分多性状是受一个主基因控制还是受紧密连锁的多个主基因控制.(4)对遗传力和样本容量两个影响主基因检测功效的关

5、键因素来说,其作用效果则是遗传力明显大于样本容量.以水稻杂交组合多蘖矮X中花ll的F2群体597个植株株高和分蘖数为例演示了分析程序。结果表明该组合的株高和分蘖数受同一主基因控制。该主基因对株高的加性和显性效应分别为-21.3锄和40.6cm,表现为超显性;对分蘖数的加性和显性效应则分别为22.7和.25.3,表现为接近完全显性.上述MSA不仅可以估计模型中的遗传参数,而且可计算出每个个体属于不同主基因基因型的后验概率,因此,本研究提出根据个体的贝叶斯后验概率进行个体分类的新方法,即一种基于模型的非监督动态聚类方法。该方法

6、同样是以EM算法实现的极大似然估计方法实现各个类参数估计,以个体所属类别的贝叶斯后验概率判别个体的归类。模拟研究结果表明:(1)该方法通常既可无偏估计类参数又可根据各种模型的BIC值确定最佳分类个数,从而解决传统动态聚类法类数难确定的问题.(2)与重心法动态聚类(k-means)和最小组内平方和法(MinimumSquamSumWithinQ伽融MinSSw)动态聚类相比,稳健性较高.(3)通过提高判别标准,可以有效降低误判率(MisclassifiedRate。MR).以Fisher的hig试验数据验证了方法的可行性,分

7、析结果表明基于似然函数极大为目标的非监督动态聚类方法特别适于原始数据为高斯分布的数据聚类,其误判率显著低于加n∞ns和Minssw法。DNA微阵列技术是后基因组时代功能基因组研究的主要工具之一,它可以一次同对溯出不同实验环境或不同组织的成千上万个基因的表达水平.将相似表达模式的基因聚在一个类中的基因聚类分析,是提取基因表达谱数据潜在生物学信息的有用工具,同时也是徽阵列数据分析中使用最为广泛的一类方法.聚类技术依据先验信息的有无,又可分为非监督聚类和监督聚类.为了探讨上述基于模型的聚类方法应用于高维微阵列表达谱数据分析的可行

8、性,分别用计算机模拟数据、酵母细胞周期微阵列数据以及人类癌细胞NCI.石0微阵列数据进行聚类分析,并与七.最近邻居法(k-NearestNcighbouz,心m),二分类支持向量机器(SupprotV∞tofMachin姻,SVMs)以及多分类SVMs(MulticatcgorySVMs,MC-SVl恤

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。