bioperl中文指南

bioperl中文指南

ID:47041043

大小:154.50 KB

页数:31页

时间:2019-07-05

bioperl中文指南_第1页
bioperl中文指南_第2页
bioperl中文指南_第3页
bioperl中文指南_第4页
bioperl中文指南_第5页
资源描述:

《bioperl中文指南》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Bioperl操作指南camelbbs@gmail.comBioperl为许多经典的生物信息学程序提供了软件模块,这些包括:从本地或远程数据库获取数据;转换数据库或文件记录的格式;操作单个序列;搜索相似序列;创建和进行序列比对;搜索基因组上的基因及其它结构;发展机器可读的序列注释;下面的章节将描述bioperl怎样执行这些任务;III.1从本地和远程数据库中获取数据bioperl主要集中于序列操作,但是在用bioperl操作序列之前,需要获取序列数据。现在你可以直接将序列数据输入到bioperl的Seq对象,例如:$seq=Bio:

2、:Seq->new(-seq=>'actgtggcgtcaact',-desc=>'SampleBio::Seqobject',-display_id=>'something',-accession_number=>'accnum',-alphabet=>'dna');然而,在大多数时候,从在线文档及数据库中获取序列更优越。注意在生物信息学的传统叫法中有时候被称作“数据库”的很可能是一个“索引平台文件”。Bioperl支持远程数据获取,也可为访问本地数据库创建索引。有两个普通的方法完成这个。如果你知道序列储存在什么样的数据库中(例如

3、文本文件、本地关系型数据库或一个internet上可访问的远程数据库),你可以写一个脚本特定地从这些数据库中获得数据。这种方法将在III.1.1节和III.1.2节中描述,这两节分别讲如何从远程数据库和本地的索引平台文件中获取数据。明确地从本地关系型数据库中获取序列数据需要安装和设置bioperl-db库和BioSQL计划中的模块,更多介绍可见IV.3节。另一个方法是使用最近发展起来的OBDA(OpenBioinformaticsDataAccess)注册系统。使用OBDA可以从一个数据库中输出序列而不需要知道可访问的数据库是平台文

4、件还是关系型,甚至不管它是本地的还是仅能从网上获得的。关于怎样安装必须的注册配置文件和获取序列数据已在doc/howto中的BIODATABASE_ACCESS中叙述,这里不再重复。III.1.1获取远程数据(Bio::DB::GenBank等)Bioperl可以直接从主要的分子生物学数据库中获取序列数据。数据可以通过序列的获取号或id来获得。还可以进行批量获取以方便地获取多重序列。例如,从genbank中获取数据的代码如下:$gb=newBio::DB::GenBank();#thisreturnsaSeqobject:$seq1

5、=$gb->get_Seq_by_id('MUSIGHBA1');#thisreturnsaSeqobject:$seq2=$gb->get_Seq_by_acc('AF303112');#thisreturnsaSeqIOobject:$seqio=$gb->get_Stream_by_id(["J00522","AF303112","2981014"]);更多信息见III.2.1关于使用SeqIO对象。Bioperl当前支持从genbank,genpept,Refseq,swissprot和EMBL数据库中获取序列数据。更多信息

6、见Bio::DB::GenBankmanpage,theBio::DB::GenPeptmanpage,theBio::DB::SwissProtmanpage,theBio::DB::RefSeqmanpage和theBio::DB::EMBLmanpage。用户可以为一个数据库指定不同的数据库镜像--特别相关的是SwissProt资源有许多ExPaSy镜像。还有一些为那些后台防火墙指定本地的代理服务器的配置项。获取NCBIRefSeqs序列可以通过一个叫Bio::DB:RefSeq的特定模块来查询EBI服务器。使用之前可以参考B

7、io::DB::RefSeqmanpage,有一些关于获取RefSeq的告诫。RefSeq在Genbank中的id一般是以"NT_","NC_","NG_","NM_","NP_","XM_","XR_",or"XP_"开头(更多信息见http://www.ncbi.nlm.nih.gov/LocusLink/refseq.html)。严格来说Bio::DB:GenBank可被用来获取与这些id一致的entries,但是记住它们不是Genbankentries。关于获取以"NT_"开头的entries的特定细节见Bio::DB::G

8、enBankmanpage,这些是经过特别格式化的"CONTIG"entries。Bioperl也支持从一个远程Ace数据库中获取序列。这个功能需要另外的AcePerl模块。你需要下载并安装aceperl模块,见http://stei

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。