生物信息学大实验实验指导

生物信息学大实验实验指导

ID:5791610

大小:1.26 MB

页数:41页

时间:2017-12-24

生物信息学大实验实验指导_第1页
生物信息学大实验实验指导_第2页
生物信息学大实验实验指导_第3页
生物信息学大实验实验指导_第4页
生物信息学大实验实验指导_第5页
资源描述:

《生物信息学大实验实验指导》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、生物信息学大实验生物信息学大实验实验指导适用专业:生物信息学生物与制药大类编写:解增言生物信息学院2014年4月41生物信息学大实验目录实验1基因组序列组装(软件CAP3的使用)3实验2基因组序列组装(软件velvet的使用)7实验3原核生物基因识别(软件Glimmer的使用)9实验4真核生物基因识别(软件GlimmerM的使用)17实验5HAP3基因家族的多序列比对分析(软件ClustalX与ClustalW的使用)25实验6HAP3基因家族的分子进化分析(软件PHYLIP和MEGA的使用)28实验7HAP3基因家族的

2、分子进化分析(软件MrBayes的使用)33实验8HAP3蛋白的结构分析(软件RasMol的使用)4241生物信息学大实验实验1基因组序列组装(软件CAP3的使用)一、实验目的1.了解基因组测序原理和主要策略;2.掌握CAP3序列组装软件的使用方法。二、实验原理基因组测序常用的两种策略是克隆法(clone-basedstrategy)和全基因组鸟枪法(wholegenomeshotgunmethod)。克隆法先将基因组DNA打成大的片段,连到载体上,构建DNA文库;再对每一个大片段(克隆)打碎测序。序列组装时先组装成克隆

3、,再组装成染色体。克隆测序法的好处在于序列组装时可以利用已经定位的大片段克隆,所以序列组装起来较容易,但是需要前期建立基因组物理图谱,耗资大,测序周期长。全基因组鸟枪法测序无需构建各类复杂的物理图谱和遗传图谱,采用最经济有效的实验设计方案,直接将整个基因组打成不同大小的DNA片段构建Shotgun文库,再用传统Sanger测序法或Solexa等新一代测序技术对文库进行随机测序。最后运用生物信息学方法将测序片段拼接成全基因组序列。该方法具有高通量、低成本优势。序列组装时,先把把单条序列(read)组装成叠连群(contig

4、)、再把叠连群组装成“支架”(scaffold),最后组装成染色体。本实验将练习在Linux环境下用CAP3软件组装流感病毒基因组。1.CAP3序列组装程序简介HuangXiaoqiu.和Madan,A.开发的一套用于序列拼接的软件,此软件适用于小的数据集或EST拼接,它有如下特征:1.应用正反向信息更正拼接错误、连接contigs。2.在序列拼接中应用reads的质量信息。3.自动截去reads5`端、3`端的低质量区。4.产生Consed程序可读的ace格式拼接结果文件。5.CAP3能用于Staden软件包的中的GA

5、P4软件。2.下载此软件可以免费下载,下载地址:http://seq.cs.iastate.edu/download.html。填写基本信息表格,即可下载。CAP3详细参考文档可见:http://genome.cs.mtu.edu/sas.html。3.安装(1)上传cap3的压缩包到本地linux/unix运算服务器;(2)解压缩:      bash-2.05b$tarxvfcap3.tar      CAP3/41生物信息学大实验      CAP3/README      CAP3/cap3      CAP3/

6、doc      CAP3/aceform      CAP3/formcon(3)查看解压缩后的文件:      bash-2.05b$ls–l      total240      -rwxr-xr-x   1soft bgi      25844Sep2  2002formcon*      -rwxr-xr-x   1soft bgi     169836Sep2  2002cap3*      -rw-r-----   1soft bgi        513Aug22 2002README      -rw-

7、------   1soft bgi      18448Aug22 2002aceform      -rw-r-----   1soft bgi      18922Jun21 2002doc4.使用程序运行命令行:cap3 [options]>cap3.out5.输入:输入序列是普通的FASTA格式,如果序列文件名为“xyz”,则质量文件应命名为“xyz.qual”,约束文件应命名为“xyz.con”。在命令行中只需输入序列文件,程序会自动在相应的目录中寻找相应的质量文

8、件和约束文件。“xyz”格式如下:>Sequence1ACGTGCGCGATCGCCTGCTAGGCGTACGTCGCAGGCGATCGATGTGCTAGATCAGATGACA>Sequence2GGGCTAGATTAGCACCACATACATCGCTCA“xyz.qual”格式如下:>R16 8 8 8151717

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。