生物信息学题库精校整理(word版)

生物信息学题库精校整理(word版)

ID:31810812

大小:48.29 KB

页数:16页

时间:2019-01-18

生物信息学题库精校整理(word版)_第1页
生物信息学题库精校整理(word版)_第2页
生物信息学题库精校整理(word版)_第3页
生物信息学题库精校整理(word版)_第4页
生物信息学题库精校整理(word版)_第5页
资源描述:

《生物信息学题库精校整理(word版)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、生物信息学题库一、名词解释1、生物信息学:生物分子信息的获取、存贮、分析和利用;以数学为基础,应用计算机技术,研究生物学数据的科学。2、相似性(similarity):相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。3、同源性(homology):生物进化过程中源于同一祖先的分支之间的关系。4、BLAST(BasicLocalAlignmentSearchTool):基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。5、HMM隐马尔可夫模型:是蛋白质结构域家族序列的一种严格的统计

2、模型,包括序列的匹配,插入和缺失状态,并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。6、一级数据库:一级数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释(投稿文章首先要将核苷酸序列或蛋白质序列提交到相应的数据库中)7、二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的。8、GenBank:是具有目录和生物学注释的核酸序列综合公共数据库,由NCBI构建和维护。9、EMBL:EMBL实验室:欧洲分子生物学实验室。EMBL数据库:是非盈利性学术组织EMBL建立的综合性数据库,EM

3、BL核酸数据库是欧洲最重要的核酸序列数据库,它定期地与美国的GenBank、日本的DDBJ数据库中的数据进行交换,并同步更新。10、DDBJ:日本核酸序列数据库,是亚洲唯一的核酸序列数据库。11、Entrez:是由NCBI主持的一个数据库检索系统,它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。12、SRS(sequenceretrievalsystem):序列查询系统,是EBI提供的多数据库查询工具之一。有与Entrez类似的功能,还提供一系列的序列分析工具,可以直接进行在线序列分析处理。13、EST:收集大量cDAN或EST序列以及其他相

4、关信息,目前最大的公共表达序列数据库。14、GSS:GeneBank数据库的一部分,收集基因组DNA克隆的测序序列。15、GEO:基因表达精选集是一个储存高通量功能基因组学数据的数据库。16、SCOP数据库:提供关于已知结构的蛋白质之间结构和进化关系的详细描述,包括蛋白质结构数据库PDB中的所有条目。17、PROSITE:是蛋白质家族和结构域数据库,包含具有生物学意义的位点、模式、可帮助识别蛋白质家族的统计特征。18、RefSeq:是一个收录注释过的非冗余转录本、蛋白质和基因组序列的数据库。19、结构域Structuredomain:结构域,是在蛋白质三级结构中介于二级和三级结

5、构之间的可以明显区分但又相对独立的折叠单元。20、开放阅读框ORF:开放阅读框,位于DNA或RNA上起始密码子与终止密码子之间的序列。21、启动子Promoter:启动子是基因的一个组成部分,是位于结构基因5‘端上游区的DNA序列,控制基因表达(转录)的起始时间和表达的程度。22、3’UTR:3’非翻译区的缩写,真核生物的转录终止信号是在3’非翻译区的:polyA。23、CpGisland:是在哺乳动物基因组中的一个500bp到300bp的区域,富含GC。24、模体Motif:又称模体,蛋白质序列中短的保守区域,它们是结构域中保守性很高的部分。25、PDB(ProteinDat

6、aBank):蛋白质结构数据库,是国际上著名的生物大分子结构数据库,由美国Brookhaven国家实验室建立。26、打分矩阵(scoringmatrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。27、遗传连锁图:又叫遗传图谱(geneticmap)是以具有遗传多态性的遗传标记为“路标”,以遗传学距离为图距的基因组图。28、蛋白质组(proteom):是指一个基因组、一种生物或一个细胞/组织的基因组所表达的全套蛋白质。29、基因组学:研究生物基因组和如何利用基因的一门学问。30、比较基因组学:

7、是在基因组图谱和测序的基础上,利用某个基因组研究获得的信息推测其他原核生物、真核生物类群中的基因数目、位置、功能、表达机制和物种进化的学科。31、FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。32、genbank序列格式:是GenBank数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。