基于序列非比对法的病毒感染特定宿主细胞的可能性评估研究

基于序列非比对法的病毒感染特定宿主细胞的可能性评估研究

ID:37062772

大小:3.00 MB

页数:57页

时间:2019-05-16

基于序列非比对法的病毒感染特定宿主细胞的可能性评估研究_第1页
基于序列非比对法的病毒感染特定宿主细胞的可能性评估研究_第2页
基于序列非比对法的病毒感染特定宿主细胞的可能性评估研究_第3页
基于序列非比对法的病毒感染特定宿主细胞的可能性评估研究_第4页
基于序列非比对法的病毒感染特定宿主细胞的可能性评估研究_第5页
资源描述:

《基于序列非比对法的病毒感染特定宿主细胞的可能性评估研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于序列非比对法的病毒感染特定宿主细胞的可能性评估研究作者姓名臧翔学科专业凝聚态物理指导教师刘雪梅副教授所在学院物理与光电学院论文提交日期2018年4月EvaluationofthePossibilityofVirusInfectionHostCellbySequenceAlignment-FreeStatisticsADissertationSubmittedfortheDegreeofMasterCandidate:XiangZangSupervisor:XueMeiLiuSouthChinaUniversityofTechnologyGuangzho

2、u,China分类号:O469学校代号:10561学号:201520122306华南理工大学硕士学位论文基于序列非比对法的病毒感染特定宿主细胞的可能性评估研究作者姓名:臧翔指导教师姓名、职称:刘雪梅副教授申请学位级别:理学硕士学科专业名称:凝聚态物理研究方向:生物信息论文提交日期:2018年4月14日论文答辩日期:2018年5月31日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:冯兆庆委员:文德华朱瑞董有忠张向东摘要尽管病毒对人类健康及垃圾降解都起着非常重要的作用,但它们很难被研究。科学家不能在实验室培养大多数病毒,且鉴定它们的遗传序列通常很难,

3、因为它们的基因组成小而且进化速度快。随着新一代测序技术的发展,人类得以进一步探知生命的本质和起源,数以百万计的生物学数据库如雨后春笋般的迅速出现和成长,通过深入分析大量生物学数据,可以更好地了解病毒基因组的多样性,以及病毒和它们的宿主细胞及环境之间的相互作用。毒感染宿主细胞的研究对于了解微生物群落的功能和动态具有重要的意义,病毒是依赖于其宿主细胞的分子机制进行复制并产生子代病毒颗粒的。数据表明,病毒与宿主细胞在遗传信息上具有相似的字模式(K-tuple),病毒的DNA序列和其可感染的宿主细胞的DNA序列通过字模式的统计打分值往往比与随机的宿主细胞打分值高,也就是病毒和

4、其可感染的宿主细胞的DNA序列有一定的相似性。对于病毒和宿主细胞之间的相似性,利用K-tuple的频率分布来描述物种的序列特征,这给通过K-tuple算法对微生物聚落进行比较提供了理论依据。对于某个微生物聚落的比对结果,其仅仅以K-tuple的一个频率向量作为表示,而与序列的参考基因没有关系。两序列的比对,也即是通过比较K-tuple的特征向量,得到一个表示两序列距离的打分值,进而比较两序列的相似性或相异性。目前经典的基于K-tuple频率分布的非比对法有Eu、d2star、d2S、Hao和Ch等。本论文使用Eu、d2star、d2S、Hao和Ch这五种非比对算法对病

5、毒识别的优劣性通过ROC曲线和AUC柱状图进行了比较;另外对这五种算法的全局比对和局部比对进行了分析;发现d2star和d2S方法效果优于其他三种方法,更适合于病毒的研究。接下来使用d2star和d2S方法对病毒聚类进行了探讨,发现d2S对病毒的聚类效果优于d2star,最后使用d2star和d2S非比对,对病毒的DNA序列和宿主细胞的DNA序列进行打分,通过该打分值与获得的阈值进行比较,来判断该病毒是否能入侵宿主细胞,进而寻找出探究病毒和宿主细胞关联性的有效方法。基于K-tuple频率分布的序列非比对法来探讨病毒和宿主细胞的相似性目前研究的比较少,通过使用基于K-t

6、uple的非比对法可以加速宏基因组研究并来寻找科学界所未知的病毒。进而成为一个探索地球上病毒的巨大的且未知的多样性的一个新兴工具。关键词:病毒;宿主细胞;d2star非比对法;d2S非比对法;K-tuple;聚类IABSTRACTAlthoughvirusesplayaveryimportantroleinhumanhealthandwastedegradation,theyaredifficulttostudy.Mostvirusescannotbecultivatedinthelaboratory,andtheirgeneticsequencesareoftend

7、ifficulttobeidentifiedbecausetheirgenesaresmallandevolverapidly.Withthedevelopmentofnext-generationsequencingtechnology,humanbeingscanfurtherexplorethenatureandoriginoflife.Millionsofbiologicaldatabaseshavesprungupandgrownuplikemushrooms.Throughin-depthanalysisofalargenumberofb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。