欢迎来到天天文库
浏览记录
ID:39849717
大小:1.17 MB
页数:35页
时间:2019-07-13
《生物信息学研究方法概述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二章生物信息学研究方法概述马飞南京师范大学比较基因组学与生物信息学实验室一、生物信息学研究方法概述1生物信息学研究的三个层面初级层面中级层面高级层面初级层面基于现有的生物信息数据库和资源,利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题——生物信息数据库(NCBI、EBI等)——基因组序列分析、序列比对软件(GCG、BLAST、CLUSTAL等)——系统发育树构造软件(PHYLIP、PALM、MEGA等)——分子动力学模拟软件(GROMACS、NAMD等)——搜集、整理有特色的生物信息学数据集中级层面利用数值计算方法、数理统计方法和相关
2、的工具,研究生物信息学问题——概率、数理统计基础——科学计算基础——现有的数理统计和科学计算工具(EXCEL、SPSS、SAS、MATLAB等)——建立有特色的生物信息学数据库高级层面提出有重要意义的生物信息学问题;自主创新,发展新型方法,开发新型工具,引领生物信息学领域研究方向。——面向生物学领域,解决生物学问题——数学、物理、化学、计算科学等思想和方法——建立模型,发展算法——自行编程,开发软件,建立网页(Linux系统、C/C++、PERL、数据库技术)http://rich.yunda.org/test/amphioxusest/http:/
3、/rich.yunda.org/test/rg01/index.php从事生物信息学研究应具备多方面的科学基础(1)、一定的计算能力,包括相应的软、硬设备。要有各种数据库或者能与国际、国内的数据库系统进行有效的交流。要有发达、稳定的互联网络系统;(2)、强有力的创新算法和软件。没有算法创新,生物信息学就无法获得持续的发展;(3)、与实验科学,特别是与自动化的大规模高通量的生物学研究方法与平台技术建立广泛、紧密的联系。这些技术,既是产生生物信息数据的主要方法,又是验证生物信息学研究结果的关键手段。从事生物信息学研究的人员必须具备多学科交叉的知识。2生物
4、信息学的“降龙十八掌”第一式见龙在田(1)掌握生物信息数据库及其查询搜索方法(Database&searching)——对分子生物信息数据库的种类以及某些具体数据库的掌握和了解——从现有数据库中熟练获得需要的数据信息(尤其是二级数据库)——能熟练地进行数据库查询和数据库搜索(数据库查询系统Entrez、SRS;搜索工具BLAST等)——数据库技术、互联网技术第二式飞龙在天(2)学会生物信息学软件和工具的应用(Software&application)利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题——基因组序列分析、序列比对软件(GCG、
5、BLAST、CLUSTAL等)——系统发育树构造软件(PHYLIP、PALM等……)——基因芯片检测分析软件(商业软件ScanArray、Array-Pro等……)——分子动力学模拟软件(GROMACS、NAMD等……)第三式鸿渐于陆(3)掌握概率论基础(Probabilitytheory)——随机事件、概率——随机变量、概率分布——大数定律、中心极限定理——几乎用于生物信息学的各个方面“Mostoftheproblemsincomputationalsequenceanalysisareessentiallystatistical.”——“Biol
6、ogicalsequenceanalysis”第四式或跃在渊(4)掌握数理统计基础(Statisticalmethods)——样本和统计量(方差、均值……)——参数估计、假设检验——基本的统计分析(方差分析、协方差分析、回归分析)——常用统计软件的运用(SPSS、SAS)——几乎用于生物信息学的各个方面第五式羚羊触藩(5)熟悉基于频率的组分分析方法和权重矩阵方法(Compositionanalysis&weightmatrixmethod)——符号(如碱基)频率反映具有生物学意义的序列特征,如内含子剪接位点的发现,KOZAK规则的发现等——核酸组分、
7、氨基酸组分、密码子使用频率——k-tuples/k-mers频率分析——权重矩阵(weightmatrix)分析——主要用于具有特定生物学意义的序列特征的分析权重矩阵分析方法举例例:人类基因内含子/外显子剪接位点的序列特征分析R=AorGY=CorUN=A,G,CorU供体位点受体位点Bayesian打分函数用于剪接位点预测的公式Thelikelihoodthatapropertyvaluev(ofanewstructure)isdrawnfromthesplicingsiteis:Scorefortheoveralllikelihoodoftheq
8、uerysequencebeingasiteis:SaywehaveasequenceS=S1S2…Sn.T
此文档下载收益归作者所有