生物信息学资料整理简约版.doc

生物信息学资料整理简约版.doc

ID:59145887

大小:24.50 KB

页数:3页

时间:2020-09-11

生物信息学资料整理简约版.doc_第1页
生物信息学资料整理简约版.doc_第2页
生物信息学资料整理简约版.doc_第3页
资源描述:

《生物信息学资料整理简约版.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1.生物信息学(Bioinformatics):是研究生物信息的采集,处理,存储,传播,分析和解释等各方面的学科。新兴的交叉学科。PS:生物分子至少携带着三种信息–遗传信息–与功能相关的结构信息–进化信息2.生物信息学主要研究两种信息载体:DNA和蛋白质(1)遗传信息的载体——DNADNA通过自我复制,在生物体的繁衍过程中传递遗传信息;基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性状。(2)蛋白质的结构决定其功能蛋白质功能取决于蛋白质的空间结构蛋白质结构决定

2、于蛋白质的序列(这是目前基本公认的假设),蛋白质结构的信息隐含在蛋白质序列之中。3.序列数据库有哪些?特点?如何检索?(1)基因组序列数据库:GenomeDatabase(GDB)数据库:包括人、鼠、斑马鱼和果蝇4种真核生物基因组的注释分析。由EMBL-EBI和Sanger研究所联合开发。UCSCGenomeBrowser:加州大学圣克鲁兹分校建立,包括各种脊椎和无脊椎动物,以及主要模式生物的基因组数据。(2)核酸序列数据库:EMBLDDBJGenBank三个数据库每天互相交换数据,GenBan

3、k可通过NCBI的检索系统Entrez获取,Entrez集成来自主要DNA和蛋白序列数据库的数据,包括物种、基因组、定位、蛋白结构和结构域等信息。(3)蛋白质序列数据库:UniProtIPINr4序列标签位点STS序列标签位点(sequence-taggedsite),是已知核苷酸序列的DNA片段,是基因组中任何单拷贝的短DNA序列,长度在100~500bp之间。任何DNA序列,只要知道它在基因组中的位置,都能被用作STS标签。5.CDS和ORF的区别(1)开放读码框是从一个起始密码子开始到一个

4、终止密码子结束的一段序列;不是所有读码框都能被表达出蛋白产物,或者能表达出占有优势或者能产生生物学功能的蛋白。(2)CDS,是编码一段蛋白产物的序列。(3)CDS可能是一个ORF,但也可能包括多个ORF。(4)反之,每个ORF不一定都是CDS。开放阅读框是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白。6什么是序列比对?(同源性,一致性,直系和旁系)序列比对:为评价相似性(similarity)的程度或同源性(homology)的可能,将两个或更多的序列排列起来以得到最大一致性(id

5、entity)(即相同或相似性)的过程。同源性(homolog):序列源于共同的祖先而产生的相似性直系(直向)同源(orthology):同祖同功不同种旁系(共生)同源(paralogy):同祖同种不同功7.全局比对和局部比对全局比对方法是DynAmicprogrAmming(动态规划)方法对生物序列比对的最早运用,该算法保证能找到较好的比对结果,是将两个序列从头到尾比较。局部比对则找到优化匹配的子序列(subsequence),然后进行比对。数据库搜索几乎都是使用局部比对。局部比对比全局比对快

6、,但是牺牲了准确性。全局比对-混乱的比对结果局部比对-找出保守区域的效果更好8.BLAST和FASTA区别FASTA是一个DNA、蛋白质序列比对软件包,最早由DAvidJ.LipmAn&WilliAmR.PeArson(1985)创建,有很多变种,理论上可以对任何字母表产生的序列起作用,可以在线搜索,也可以下载到本地使用,EBI提供在线搜索版本fAstA33。BLAST,提供在线版本(NCBI)和不同的软件实现(implement),BLAST也是一种近似Smith-WAtermAn算法的启发式

7、算法,稍微不太精确,但要快50倍以上。9.功能位点和基序功能位点(functionAlsite):DNA序列中,除基因外,还包含其它信息,如调控因子等,存放这些信息的DNA片段称为功能位点。基序(motif):DNA,蛋白质等生物大分子中的保守序列,在反式作用因子的结构中,基序一般指构成任何一种特征序列的基本结构(既指此具功能的基本结构,也指编码此结构的蛋白质/DNA序列),作为结构域中的亚单元,其功能是体现结构域的多种生物学作用。10.CPG岛CpG岛是一类长度在几百bp的DNA序列,其中CG

8、核苷酸出现的频率非常高。若CpG岛长度已知,位置未知,则无法确定某个碱基是在岛内还是岛外,这时需要用隐马尔科夫模型。11.进化树系统发生树也叫系统树,进化树(evolutionarytree)或生命树(treeoflife),是对物种之间的进化关系的一种描述,这些物种被认为有共同祖先。涉及的特性:距离描述序列之间的差别(遗传距离)一般用距离矩阵(distAncemAtrix)表示距离往往由序列比对产生(如错配的比例)离散特征二态特征(如:DNA序列上的某个位点是否剪切位点)多态特征(如:某一位点

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。