福建农林大学生物信息学复习材料

福建农林大学生物信息学复习材料

ID:14050677

大小:58.00 KB

页数:5页

时间:2018-07-25

福建农林大学生物信息学复习材料_第1页
福建农林大学生物信息学复习材料_第2页
福建农林大学生物信息学复习材料_第3页
福建农林大学生物信息学复习材料_第4页
福建农林大学生物信息学复习材料_第5页
资源描述:

《福建农林大学生物信息学复习材料》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、概念生物信息学狭义:分子生物信息学,用信息技术存储、分析基因组、蛋白质组序列。广义:指生物科学与信息科学与计算机科学、物理学、化学交汇融合的交叉学科。信息:指能够消除人们不确定性的东西。信息可以计算Score:衡量匹配结果的质量,是相对的(与选取的计分依据有关),越高越好E值:expectationvalue评估相似性,是绝对的,越低越好P值:P0表示越显著结果越可信,P∞结果随机产生的可能性越大)是指获得至少与两条无关序列间的偶然相似性一样高的分值的概率,低P值表明重要的匹配,这些匹配可能会有生物学意义重

2、复序列:真核生物的基因组中具有多数反复存在的DNA顺序组成(一般不参与编码)用Repeatmasker软件查找重复序列序列谱:由多序列对比结果的全部信息构造的序列特征表,表中列出每一个位点氨基酸残基的替代.插入,缺失等情况双序列比对:通过一定的算法对两个DNA或蛋白质的序列进行比较,找出两者之间最大相似性的方法。工具是用程序来编写完成算法。记分矩阵:为了反映两个序列比对结果而预先设定的分值矩阵。取代矩阵:PAM、BLOSUM稀疏矩阵:只有相同的为1,其余的为0,大多数矩阵单元的值为0。DP(动态规划):按某

3、种条件舍去那些不可能得到最有结果的局部解。全局比对:对给定序列全长进行比较的方式,在待比较两个序列中引入间隔,使得对序列的全场都得到比较。局部比对:对序列进行比较时,更注重局域的最佳匹配比对工具:Blast、FASTA、Smith-watermanBLAST(BasicLocalAlignmentSearchTool)ORF:一个起始密码子和终止密码子之间的序列称为开放阅读框。1.生物信息学研究内容分为哪三个部分?四个分支① 核酸与基因组信息学:(1)测序与拼接(2)基因识别与注释(3)SNP(单核苷酸多态

4、性)分析(4)非编码区信息分析(5)比较基因组学② 蛋白质组信息学:(1)蛋白质结构模拟(2)蛋白质功能预测(3)基因表达到蛋白质产物信息分析③ 代谢调控网络④ 生物进化分析数据库、算法、算法工具分析生物学数据2.生物信息学中两种最基本研究方法?主要的不同点① 模式识别(数据)---同原序列、异源序列② 结构模拟预测(计算)----结构:chou.Fasman;;物理化学;算法工具3.计算机里的专业术语5TCP----传输控制协议IP---互联网协议DNS-----域名服务器LAN----局域网WAN---

5、-广域网http---超文本传输协议ftp---文件传输协议Telnet----在UNIX平台上远程连接间的协议51.DNA数据库的类型① 常规数据库:从全基因组单基因序列② 特定数据库:模式生物基因组数据库;另一类则与特殊党的测序技术有关2.最主要三个DNA数据库:EMBL、Genbank、DDBJ3.数据库的搜索方法、各自的特点GenBank----Entrez(集成检索系统)EMBL------SRS(序列检索系统)Entrez特点:①使用简便,把不同类型的DB有机的结合在一起,通过超文本链接,用户可

6、以从一个数据库直接转入另一数据库②数据库和应用程序结合在一起。EBI的SRS系统SRS可以将不同文本格式的数据库真和成为统一的模式。4.Entrez集成了哪些数据库PubMed:生物医学文献核苷酸序列数据库(Genbank)蛋白质序列数据库Structure:三维大分子结构Genome:全基因组PopSet:人口研究的数据集OMIM:在线人类孟德尔遗传UniSTS:标记和映射数据5.GenBankEMBL之间对应关系及一条记录的含义GenBank:locusdefinitionaccessionversio

7、ntitleEMBL:IDDEACSVRT序列名称序列简单说明序列编号序列版本号题目GenBank:keywordssourceorganismreferenceauthorsEMBL:KWOSOCRNRA关键词序列来源物种名称种属相关文献编号著者5PubMed:生物医学文献(PubMed)核苷酸序列数据库(Genbank)蛋白质序列数据库Structure:三维大分子结构Genome:全基因组PopSet:人口研究的数据集OMIM:在线人类孟德尔遗传UniSTS:标记和映射数据SNP:单核苷酸多态性CDD

8、:保守结构域5第三章1.蛋白质序列数据库类型① 序列数据库:PIR(最早提出的蛋白质数据库),SWISS-PROT(更好用),NCBI② 模式和结构域数据库:PROSITE(二级),PFAM③ 结构数据库:PDB(三级)④ 结构分类数据库:SCOP,CATH,FSSP(四级)2.序列数据库记录的特点① Pir蛋白质信息资源(蛋白质序列)② SWISS-PROT有注解的蛋白质序列数据库3.SWISS-PORT记录的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。