基于降维与分类的单细胞RNA测序数据分析.pdf

基于降维与分类的单细胞RNA测序数据分析.pdf

ID:34668518

大小:1.90 MB

页数:46页

时间:2019-03-08

基于降维与分类的单细胞RNA测序数据分析.pdf_第1页
基于降维与分类的单细胞RNA测序数据分析.pdf_第2页
基于降维与分类的单细胞RNA测序数据分析.pdf_第3页
基于降维与分类的单细胞RNA测序数据分析.pdf_第4页
基于降维与分类的单细胞RNA测序数据分析.pdf_第5页
资源描述:

《基于降维与分类的单细胞RNA测序数据分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于降维与分类的单细胞RNA测序数据分析DATAANALYSISBASEDONDIMENSIONREDUCTIONANDCLUSTERINGOFSINGLECELLRNASEQUENCING吴德亮哈尔滨工业大学2018年6月国内图书分类号:O213.9学校代码:10213国际图书分类号:519.2密级:公开理学硕士学位论文基于降维与聚类的单细胞RNA测序数据分析硕士研究生:吴德亮导师:靳水林副教授申请学位:理学硕士学科:应用统计所在单位:数学系答辩日期:2018年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:O213

2、.9U.D.C:519.2DissertationfortheMasterDegreeinScienceDATAANALYSISBASEDONDIMENSIONREDUCTIONANDCLUSTERINGOFSINGLECELLRNASEQUENCINGCandidate:WuDeliangSupervisor:Assoc.Prof.JinShuilinAcademicDegreeAppliedfor:MasterofScienceSpeciality:AppliedStatisticsAffiliation:DepartmentofMathem

3、aticsDateofDefence:June,2018Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学应用统计硕士专业学位论文摘要单细胞RNA测序技术是新一代的测序技术,不仅具有第二代高通量测序技术的测序高通量与高深度的优势,同时还具有可以准确测量单个细胞状态的特性,可以降低细胞间相关性。近些年来,单细胞RNA测序技术在众多领域都有着重大进展,已经变成了研究细胞动力学的一种强有力的工具。本文主要提出了一种识别单细胞RNA测序数据具体细胞亚型的分析算法。首先通过一种新

4、的算法确定单细胞数据的聚类数,其次对数据进行筛选和Linnorm标准化处理,使其数量级处于同一水平,便于提取信息。然后用TSNE算法将数据降低到一定维度并对其聚类,聚类的结果可以通过ARI值进行评价。接下来运用Kruskal-Wallis检验和Wilcoxon-Mann-Whitney检验来检验差异性表达基因,最后根据数据库中实际的细胞亚型结果并运用Fisher精确检验确定细胞亚型。本文选取了六篇论文中的公开数据作为实证分析中的处理数据集,并主要选取两组数据集的结果进行展示。按照本文提出的识别单细胞RNA测序数据具体细胞亚型的分析算法流程对所有数

5、据集处理并分析。从聚类的可视化结果和与其他算法的ARI值比较上看,聚类数目与实际结果十分接近,聚类结果的准确性较高,稳定性还有待提高。然后根据Wilcoxon秩和检验确定了差异性表达基因,并利用Fisher精确检验和数据库进行比对确定了相应的细胞亚型。最后还对本文算法的优点与不足进行了分析并提出了一些可行的构想,并在文末对全文做了总结。关键词:单细胞RNA序列测序;细胞聚类数;标准化;降维;差异性表达基因;细胞亚型-I-哈尔滨工业大学应用统计硕士专业学位论文AbstractSinglecellRNAsequencingisthenewgenera

6、tionsequencingtechnology.Itnotonlyhastheadvantagesofhighthroughputanddeepsequencing,butalsocanmeasurethepropertiesofindividualcellstatesaccuratelyanddecreasethecorrelationofeachcell.Recently,singlecellRNAsequencinghasbecomeapowerfultooltostudycelldynamicsandhassignificantprog

7、ressinmanyareas.Weproposeapipelinetoclustersinglecellandidentifyspecificcellsubtypes.Firstly,wepresentanovelmethodtodeterminethenumberofclustersofsinglecellRNAdata.Next,wefilterthedataanddoLinnormnormalizationtomakesurethedataisonthesameorderofmagnitude.ThenweuseTSNEtoreducet

8、hedimensionanddothehierarchicalclusteringandtheresultcanbeevaluatedb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。