资源描述:
《生物学常用软件简介》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、生物信息学常用软件简介前言生物信息学是一门新兴的交叉学科,它将数学和计算机知识应用于生物学,以获取、加工、存储、分类、检索与分析生物大分子的信息,从而理解这些信息的生物学意义。上面是狭义的生物信息学含义,也是现阶段生物信息学的基本工作.内容概要一生物信息学软件的主要功能简介1.数据的基本处理2.序列的比对3.基因/基因组的注释4.Snp分析5.进化分析6.基因表达分析7.蛋白质结构预测二.生物学软件部分常见功能使用技巧PCR引物设计DNA、蛋白质序列同源分析及进化树构建ContigExpress----DNA序列片断拼接DNA模拟电泳三生物信息学软件的系统平台生物信息学软件一般可以分
2、成商业的和开源的两大类,大部份商业的软件都是用在windows平台下的,而大部分开源软件是在unix/linux平台下的.大部分的软件基于unix/linux平台.一生物信息学软件的主要功能简介1.数据的基本处理(1)数据的常用格式:生物信息学中数据的常用格式有:Fasta、NBRF/PIR,EMBL、CLUSRAL、Genbank、phylip等。这些格式虽然不同,但用一些软件可以进行转换,下面一起看一下Fasta和EMBLFASTA格式又称Pearson的格式,该序列格式要求序列的标题行以大于号">"开头,下一行起为具体的序列。一般建议每行的字符数不超过60个,以方便程序处理。多条
3、核苷酸序列格式即将该格式连续列出即可IDidentificationcodeforsequenceinthedatabaseACaccessionnumbergivingoriginofsequenceDTdatesofentryandmodificationKWkeycross-referencewordsforlookupupthisentryOS,OCsourceorganismRN,RP,RX,RA,RT,RLliteraturereferenceorsourceDRi.d.InotherdatabasesCCDescriptionofbiologicalfunc
4、tionFH,FTinformationaboutsequencebybasepositionorrangeofpositiionssourcerangeofsequence,sourceorganismmisc_signalrangeofsequence,typeoffunctionorsignalmRNArangeofsequence,mRNACDSrangeofsequence,positionofintronmutationsequenceposition,changeinsequenceformutationSQcountofA,C,G,Tandothersym
5、bolsgaattcgataaatctctggtttattgtgcagtttatggttccaaaatcgccttttgctgt60atatactcacagcataactgtatatacacccagggggcggaatgaaagcgttaacggcca120..//symboltoindicateendorsequenceEMBL格式(2)峰图转化(phred)Phred是phredphrap软件包的一部分,主要是用来分析和装配基因组中大片段序列。phred能处理测序仪直接生成的色谱图,并且产生相关的信息。phredphrap软件包由华盛顿大学分子生物技术学院的Phil Gre
6、en和Brent Ewing开发,主要用于学术科研活动。官方网站:http://www.phred.org中文教程:http://www.cbi.pku.edu.cn/chinese/documents/quickguide/guidePhrap.pdf(3)文件转换(phd2fasta)作用:把phred或phrap的计算结果转换成fasta格式软件的主页:http://bldg6.arsusda.gov/mtucker/Public/Consed/phd2fasta.html(4)载体屏蔽(cross_match)它是phrap软件的一部份,用于比对两套DNA序列,要求输入fast
7、a格式的数据,输出的内容可以有三种:日志、被屏蔽了相应序列后的序列文件(也是用fasta格式),标准屏幕输出。Cross_matchisageneralpurposeutilityforcomparinganytwoDNAsequencesetsusingtheSmith-Watermanalgorithm.Forexample,itcanbeusedtocompareasetofreadstoasetofvectorsequencesandp