资源描述:
《单细胞RNA测序法鉴定先天淋巴细胞谱系.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文单细胞RNA测序法鉴定先天淋巴细胞谱系IDENTIFICATIONOFINNATELYMPHOIDCELLSLINEAGEUSINGSINGLE-CELLRNASEQUENCINGDAVIDOMARRAMIREZVALLE哈尔滨工业大学2018年6月图书分类号:TP39学校代码:10213国际图书分类号:004.9密级:公开工学硕士学位论文单细胞RNA测序法鉴定先天淋巴细胞谱系硕士研究生:DavidOmarRamirezValle导师:李杰副教授申请学位:计算机科学与技术学科:计算机科学与技术答辩日期:2018年6月授予学位单位:哈尔滨工业
2、大学ClassifiedIndex:TP39U.D.C:004.9DissertationfortheMasterDegreeinEngineeringIDENTIFICATIONOFINNATELYMPHOIDCELLSLINEAGEUSINGSINGLE-CELLRNASEQUENCINGCandidate:DavidOmarRamirezValleSupervisor:Prof.LiJieAcademicDegreeAppliedfor:MasterofComputerScienceandTechnologySpeciality:Computer
3、ScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2018Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要本文研究旨在通过对单细胞RNA测序数据的分析,找出骨髓标本中不同类型的细胞。为了进行详细的分析,原始数据首先需要一个过滤和准备阶段,其中一些Linux工具用于更快、更有效的分析,在处理初始数据后,使用统计和图形软件工具是通过以下
4、数据挖掘技术来执行的。骨髓是淋巴系统的一部分,它是血液细胞的起源,它也负责生成称为白细胞的特定细胞,其负责免疫系统,这是它的的重要之处,这项研究,通过分析和理解这些细胞的内容、行为和分化,我们可以预防和治疗各种疾病。本文首先回顾了相关研究、工具及目标的详细内容,以及开展研究的背景。然后介绍了获取原始数据的不同方法和原则,并讨论了最近的研究中相关方法的优势与不足。论文还讨论了新一代测序技术及淋巴组织以使本文的工作能更清晰和深入的被理解。论文的工作整体上分为两个部分,第一部分是原始数据的准备,目的是对原始数据进行预处理,为下一步的数据分析做准备。原始数据包
5、含了大量的信息,直接分析原始数据获得任何类型的假说或者结论是非常复杂的。当前已经基于Linux平台开发了专门用于分析基因组信息的软件工具。本部分对原始数据和用于预处理的工具进行了简要介绍,包括质量控制、对小鼠参考基因组的对齐和映射以及表达基因的量化。数据预处理的结果是得到一个包含760个细胞数据的矩阵和对应细胞的遗传内容。论文数据预处理的第二部分及与初始步骤进行比较都在R平台上进行。本部分对预处理后的数据进行统计分析,并将其处理成更容易管理的形式。为此在本部分又引入新的工具和数据处理算法:数据质量控制过程作为数据的过滤,用以滤除不包含足够有用信息的细胞
6、;基于差异表达基因分析过程滤除样本中变异不显著的基因;利用降维算法将数据可视化为一个简单的二维图;便于可视化数据集内不同类型单元的聚类过程;主成分分析过程,为层次化聚类识别出主要的基因成分;利用热图对聚类和主成分分析的结果数据进行可视化;最后,为了解释统计分析的结果,论文详细描述了采用的分析和方法,并讨论了基因表达着色的方法。论文还根据细胞聚类的结果对细胞进行分类,并与其他研究工作取得的结果相对照,来分析和理解细胞的生物学功能。关键词:RNA测序;基因;基因表达;群集;热图;主成分分析;RNA对准。-i-哈尔滨工业大学工学硕士学位论文AbstractT
7、hisresearchworkaimstoidentifythedifferentkindofcellsfoundinbonemarrowsamplesofmusmusculusthroughtheanalysisofdataobtainedbysinglecellRNAsequencing.Inordertoperformadetailedanalysis,rawdatashouldfirstpassthroughafilteringandpreparationphaseinwhichsomeLinuxtoolsareusedtoallowafast
8、erandmoreefficientanalysis,aftertheinitialproce