生物信息学基础教程

生物信息学基础教程

ID:40675366

大小:235.34 KB

页数:39页

时间:2019-08-06

生物信息学基础教程_第1页
生物信息学基础教程_第2页
生物信息学基础教程_第3页
生物信息学基础教程_第4页
生物信息学基础教程_第5页
资源描述:

《生物信息学基础教程》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、生物信息学基础教程第4讲:正则表达式教程——正则表达式与模式匹配本节内容正则表达式正则表达式的定义与表示方法正则表达式中的元字符(metacharacter)VIM编辑器grep命令sed编辑器awk工具正则表达式所谓正则表达式(regularexpression,RE),指的是符合某种模式的字串,常用于从文件中或者字符串中查找和替换某些符合某种规则的字串VIM教程——linux下最常用的文本编辑器VIM编辑器三种模式:各种模式之间切换从命令行模式到插入模式:按下i键从命令行模式到附加模式:按下a键返回命令行模式:按下ESC键退出编

2、辑保存并退出:在命令行模式按下:wq不保存退出:在命令行模式按下:q!保存:在命令行模式按下:w另存为其他文件名:按下:wfilenameVIM编辑功能光标跳到文件头:命令行模式下按2下g光标跳到文件尾:按下:$光标跳到行首:按下^光标跳到行末:按下$跳到100行:按下100gVIM查找功能底行模式下输入/pattern/回车,对应符合pattern的文本就会显示为高亮底行模式下输入:m,n/pattern/,就会在第m行到第n行查找pattern并高亮显示grep教程——正则表达式的应用grep简介是Globalsearchreg

3、ularexpression(RE)andPrintouttheline的缩写强大的文本搜索工具,使用正则表达式搜索文本,并打印匹配的行在一个或者多个文件中搜索字符串模式,搜索的结果输出到屏幕,不影响文件内容grep用法grep[option]‘pattern’input_files常用grep命令选项-??为数值,同时显示匹配行的前后?行grep-2‘grep’test.txt同时显示匹配行的前后2行-c--count,只打印匹配行的行数,而不输出匹配行-ffile从输入文件中提取模式-i--ignore-case,忽略大小写-q

4、--quiet,取消显示-l仅打印匹配模式的文件清单-l打印不匹配模式的文件清单-n--line-number,在匹配行前打印行号-s--silent,不显示错误信息-v--revert-match,只显示不匹配的行-w--word-regexp,如果被<和>引用,就把表达式作为一个单词搜索grep正则表达式元字符^锚定行的开始‘^grep’匹配所有以grep开始的行$锚定行的结束‘grep$’匹配所有以grep结束的行.匹配一个非换行符的任意字符‘gr.p’匹配gr后跟一个任意字符,后为p的行*匹配0个或多个先前字符‘*gre

5、p’匹配所有0个或多个空格紧跟grep的行[]匹配一个指定范围的字符‘[Gg]rep’匹配包含Grep或grep的行[^]匹配不在指定范围内的一个字符‘[^A-FH-Z]rep’匹配所有不在A-F和H-Z范围内字符后跟rep的行()标记匹配字符‘(love)’中可以匹配love,且love被标记为1<>分别锚定一个单词的起始和结束‘’匹配以grep结束的单词x{5},x{5,},x{5,10}x正好重复5次的行、至少重复5次的行、重复次数在5-10次之间的

6、行w=[A-Za-z0-9]W=[^A-Za-z0-9]匹配所有单个(非)字母和数字字符bgrepb只匹配单词grep,不匹配egrep等练习题:这些命令都能干啥?ls–l

7、grep‘^a’grep‘test’d*grep‘test’aabbccgrep‘[a-z]{5}’aagrep‘w(es)t.*1’aagrep‘^n’datafilegrep‘4$’datafilegrep‘5..’datafilegrep‘.5’datafilegrep‘^[wesn]’datafilegrep‘[A-Z][A-Z][

8、A-Z]’datafilegrep‘ss*’datafilegrep‘[a-z]{9}’datafilegrep‘<[a-z].*n>’datafilesed教程——非交互性文本编辑sed简介首先用whichsed查看一下sed的位置一个非交互性文本编辑器,编辑文件或标准输入导出的文件拷贝sed可以随意编辑小文件或者大文件一次性处理所有改变,高效率通过行号和正则表达式指定需要编辑的行sed用法从文件的一个文本行或标准输入中读取数据,并将其拷贝到一个编辑缓冲区读取命令行或者脚本的第一条命令,并用该命令查找模式或定位行号并编辑,

9、重复过程直到命令结束sed[option]‘sed_command’input_filesed[option]–fsed_script_fileinput_filesed_script_file[option]input_filese

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。