针对高维稀疏单细胞RNA测序数据的聚类研究

针对高维稀疏单细胞RNA测序数据的聚类研究

ID:37028301

大小:3.84 MB

页数:50页

时间:2019-05-17

针对高维稀疏单细胞RNA测序数据的聚类研究_第1页
针对高维稀疏单细胞RNA测序数据的聚类研究_第2页
针对高维稀疏单细胞RNA测序数据的聚类研究_第3页
针对高维稀疏单细胞RNA测序数据的聚类研究_第4页
针对高维稀疏单细胞RNA测序数据的聚类研究_第5页
资源描述:

《针对高维稀疏单细胞RNA测序数据的聚类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、:〇335单位代码_02__L12.7:分类号>?21535081?公开学号—密级:硕士学位论文RNA测序中文论文题目:针对高维稀疏单细胞数据的聚类研究-DusAnalsisforHihimension英文论文题目:Clterygk-uencSparsescRNASeingDataq:金开秀申请人姓名:张立新指导教师:统计学专业名称:数学科学学院所在学院207.论文提交日期18年1月曰独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研宄工作及取得的研宄成

2、果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得浙江大学或其他教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研宄所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作者签名:/^签字日期:年4月今日\电学位论文版权使用授权书本学位论文作者完全了解浙江大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权浙江大学可以将学位论文的全部或部分内容编入有关数据库、。进行检索,可以采用影印

3、、缩印或扫描等复制手段保存汇编学位论文(保密的学位论文在解密后适用本授权书)学位论文作者签名:%导师签名:签字曰期&年S月:曰签字曰期:年月曰^'7学位论文作者毕业后去向:工作单位::电话通讯地址:邮编摘要在分子生物学领域一直对识别具有生物学意义的细胞亚群起着关键,无监督聚类算法性的作用.目前单细胞RNA测序技术的发明极大地促进了分子生物学的发展,同时也,对传统的无监督聚类算法提出了新的挑战.这主要是因为用单细胞RNA测序技术得,利到的高维数据往往存在极高的稀疏性和技术噪音一.对于这点基于隐变量的标准化方法,B

4、OSSA能有效减少技术噪音,保留其生物学意义上的差异.然而,该标准化方法后续的无监督聚类算法BOSSA-SC以及BOSSA-HC高度依赖参数的选取,限制了其在应用上的普适性.基于上述分析,针对单细胞RNA测序数据的聚类问题,本文提出了两阶段无监督聚类算法,不仅大大降低了原有算法对于参数的依赖性,还能在不同生物学层次上对细胞群进行无监督聚类.首先,本文改进了BOSSA聚类方法中距离的定义,利用高斯核函数重新定-SNE义细胞之间的距离借助t.随后基于密度,并降维算法将原始数据映射到低维空间中聚类算法自动识别聚类中心进行聚类,在不涉及参数选取

5、的情况下,得到待聚类细胞中具.随后有稳定区分度的大类子群,即在较高差异度上识别细胞子群,针对阶段1聚类结果中高异质性的子群开展第2阶段的聚类工作进而在较低差异度上区分细胞子群.上述两阶,,段聚类思想和分子生物学中的普遍存在的细胞结构非常吻合,实际数据的分析结果也验证了该方法的有效性.t-关键词:单细胞RNA测序SNE;稀疏;无监督聚类;高斯核函数;;密度聚类算法IAbstractt-Inthefieldofmolecularbiolounsuervisedclusterinalorihmhasbeenofreat

6、sinifigy,pggggc如cefordistinguishingthecellsuboulationswhichreresentspecificbiologicalmeanings.Atpppresentth-ttt?peinventionofsinlecellRNAseuencingechnolorealromoteshedevelo,gqgygyppof?mentmolecularbiology.Atthesametimeitbrinsanewchalleneforco

7、nventionalUnsuer,ggpvselusternAlorts.TedicutesmanresultfromtsarstandareateaidCiggihmhiffliilyhehighpiygdlofnoiseoftheseuencindata.BOSSAnormalizationwasroosedforsolvingthisroblemqgppp,var-whichisbasedonlatentiablenormalizationtoeliminatethe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。