基于安捷伦微阵列的dna甲基化差异分析

基于安捷伦微阵列的dna甲基化差异分析

ID:16107257

大小:154.00 KB

页数:37页

时间:2018-08-08

基于安捷伦微阵列的dna甲基化差异分析_第1页
基于安捷伦微阵列的dna甲基化差异分析_第2页
基于安捷伦微阵列的dna甲基化差异分析_第3页
基于安捷伦微阵列的dna甲基化差异分析_第4页
基于安捷伦微阵列的dna甲基化差异分析_第5页
资源描述:

《基于安捷伦微阵列的dna甲基化差异分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于安捷伦微阵列的DNA甲基化差异分析//.paper.edu.cn-1-中国科技论文在线基于安捷伦微阵列的DNA甲基化差异分析#滕明祥,王亚东**基金项目:高等学校博士学科点专项科研基金(20102302110037)作者简介:滕明祥,男,讲师,生物信息学通信联系人:王亚东,男,教授,生物信息学(哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001)5摘要:高通量微阵列是研究DNA甲基化修饰的重要数据来源。针对这类数据的差异分析旨在寻找更有生物学意义的DNA甲基化修饰位点成为最常见的分析内容。已有的经验贝叶斯分析模型没有回答微阵列数据概率假设分布的正确性问题,且不考虑探针读

2、取误差因素。本文针对常见的安捷伦微阵列DNA甲基化数据,设计了相应的考虑探针误差因素的基于对数正态分布的经验贝叶斯分析模型,并论证了该模型的正确性。10关键词:DNA甲基化;安捷伦微阵列;经验贝叶斯模型;探针误差中图分类号:TP391.2DNAmethylationdifferentialanalysisbasedonAgilentmicroarray15TENGMingxiang,WANGYadong(SchoolofComputerScienceandTechnology,HarbinInstituteofTechnology,Harbin150001)Abstract:Hi

3、ghthroughputmicroarraydataisonemajorresourceinDNAmethylationstudies.WiththeaimofdetectingthemostbiologicalvaluableDNAmethylationsites,differentialanalysishasbecomethefundamentaloperationonDNAmethylationmicroarraydata.Existing20empiricalBayesmodelsfordifferentialanalysisneitherdemonstratedthec

4、orrectnessoftheirbasicprobabilitydistributionassumptionsnorconsideredtheprobebiasesintroducedbypixelreading.Inthisthesis,wepresentoneempiricalBayesianmodelwithdifferentsetsofbiasesorerrorsconsideredbasedonAgilentmicroarray.Keywords:DNAmethylation,Agilentmicroarray,empiricalBayesianmodel,probe

5、biases250引言后基因组时代数据的爆炸性增长与低效的数据解析手段之间的矛盾日益凸显,而造成这种矛盾的主要原因之一是高通量生物技术的问世,如高通量微阵列技术等[1]。微阵列技术能够以数万到数百万的通量并行快速地检测各类生物学特征,因其成本在同类高通量技术中相30对较低且实验技术相对成熟而得到广泛应用。不同的生物学特征一般需要不同类型的微阵列载体来检测,同一种生物学特征也往往有多种载体可以选用。由于各类生物学特征在性质上是不同的,因此一般需要针对每一类微阵列数据设计特定的分析方法。本文主要针对基于安捷伦微阵列数据提出相应的DNA甲基化修饰差异分析方法。1材料与方法351.1安捷

6、伦微阵列数据Agilent平台(//.agilent4>>/)的CpG岛微阵列提供多种规模的全基因组范围DNA甲基化水平检测,其中规模为44K的特定载体被设计为一类双通道的微阵列技术。双通道微阵列技术在一次微阵列上并行检测对照组双方的数据,能有效降低对照组实验的比//.paper.edu.cn-2-中国科技论文在线较误差与成本。而规模为44K则表示该微阵列可同时测量约44000个位点的DNA甲基化修饰40水平,这些位点一般为60bp长度的一段DNA序列区域。在该微阵列上,44000个位点被设计为覆盖全基因组超过12000个基因的启动子区域的CpG岛,能有效针对启动子区最重要的DN

7、A甲基化修饰区域。本文所用数据下载于公共数据源GEO(.ncbi.nlm.nih.gov/geo/),数据集代号GSE15709,该数据共包含三个时间点下药物刺激与正常状态相比较的卵巢癌DNA甲基化数据[2-3]。45从数据角度,双通道微阵列可以同时测量对照两组双方的数据,其中每一组的单元数据条目的格式如表1所示。每一个条目包含三方面内容:数据单元的索引,探针读取相关数据以及基因注释。其中数据单元的索引包括该单元在微阵列上的物理位置、编号以及对应探针的物理坐标等,其注明了数据单元

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。