Linux文本处理工具.ppt

Linux文本处理工具.ppt

ID:49983548

大小:297.50 KB

页数:19页

时间:2020-03-06

Linux文本处理工具.ppt_第1页
Linux文本处理工具.ppt_第2页
Linux文本处理工具.ppt_第3页
Linux文本处理工具.ppt_第4页
Linux文本处理工具.ppt_第5页
资源描述:

《Linux文本处理工具.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、文本处理工具命令技巧使用up和down键来翻阅以前的命令按下Ctrl-r键从历史命令行中搜索命令(反向i搜索)从先前的命令中重调上一个参数Esc-.(Esc键后跟一点)Alt-.(当输入点的时候按住alt键)!$(仅上一个命令才有效)正则表达式正则表达式是一个指定文本模式的标准的UNIX语法许多命令都可接受正则表达式,包括grep、sed、vi和许多脚本语言。用.和[]来匹配字符用+、*和?来指定重复的项用^和$来指定一行的开始和结束用(、)和

2、来指定可选组正则表达式字符类[:alnum:]字母数字混排A-Za-

3、z0-9[:alpha:]字母字符A-Za-z[:blank:]空格符或者制表符[:digit:]数字0-9[:lower:]小写字母a-z[:punct:]可打印字符[:space:]空白字符[:upper:]大写字母A-Z命令行快捷-文件通配符扩展通配符扩展*–匹配0或者多个字符?–匹配任意单个字符[0-9]–匹配0-9范围内的数字[abc]–匹配该列表内的任意字符[^abc]–匹配除列表内字符外的所有字符可以使用预定义的字符类Linux正则表达式语法总结字符功能语法解释.通配符基本代表一个任意字符[abc]

4、,[a-z]包含域基本代表域内任意一个字符[^abc],[^a-z]排除域基本不包括在域内的任意字符?修饰符扩展0或者1个前面的项*修饰符基本0或者多个前面的项+修饰符扩展1或者多个前面的项[m,n]修饰符扩展前面项出现m到n次[n]修饰符扩展前面项出现n次Linux正则表达式语法总结字符功能语法解释^锚基本标出一行的开始$锚基本标出一行的结束<锚基本标出一个单词的开始>锚基本标出一个单词的结束(…)分组基本允许修饰符修饰一组字符(…

5、…)分组扩展允许指定可选的模式转义扩展取消后续字符的特殊意义实例#!/b

6、in/shIf[!$#==‘1’];thenexit1fiIfgrep“^$1:”/etc/passwd;thenecho“$1isinthehouse.”fi文本分析工具文本统计:wc文本排序:sort提取文本:cut文本合并:paste文件比较:diff文本转换:tr收集文本统计-wc(单词统计)计算单词数,行数,字节数和字符数可以针对一个文件或者标准输入$wcstory.txt392371901story.txt使用-l选项:仅仅统计行数使用-w选项:仅仅统计单词数使用-c选项:仅仅统计字节数使用-m选项:

7、统计字符数(不显示)查看文件内容-less和catcat:dump一个或者多个文件到标准输出多个文件联合在一起less:在查看文件或者标准输入的时候,每次只看一页在查看时常用的命令如下:/text:搜索textn/N:跳转到next/previous匹配的地方v:用文本编辑器打开该文件man命令中是采用less来分页的查看文件摘选-head和tailhead:显示文件的起始10行使用-n选项改变行显示tail:显示文件最后10行使用-n选项改变行显示使用-f选项来继续从输入文件复制额外的单元对于监控日志文件非常有

8、用!通过关键字来提取文本-grep打印匹配的文件行或者标准输入$grep‘john’/etc/passwd$date–help

9、grepyear使用-i选项:忽略大小写敏感搜索使用-n选项:打印匹配的行号使用-v选项:打印哪些不匹配的行使用-AX选项:在匹配数据后包含显示X行使用-BX选项:在匹配数据前包含显示X行使用-r选项:递归搜索目录使用--color=auto选项:用color颜色高亮显示匹配的数据文本排序-sort对标准输出排序-原始文件不改变$sort[options]file(s)常用选项-r:执行

10、反向(降)排序-n:执行数字排序-f:忽略字符串中的大小写-u:在输出中删除重复的行(唯一)-tc:使用c作为字段间的分隔符kX:使用c分隔符排序X字段可多次使用Sort-n-k3-t:/etc/passwd消除重复行-sort和uniqsort-u:从输入删除重复行uniq:从相邻的行中删除重复行使用-c选项统计发生重复的次数跟sort一起使用效果最好:$sortuserlist.txt

11、uniq-c提取列或字段-cut显示文件指定的列或者标准输入数据$cut-d:-f1/etc/passwdgreproot/

12、etc/passwd

13、cut-d:-f7使用-d选项来指定列分隔符(默认是TAB)使用-s选项用来忽略不包含分隔符的行使用-f选项来指定要打印的列使用-c选项来指定按字符来提取$cut–c2-5/usr/share/dict/words文件比较-diff比较两个文件的不同$difffoo.conf-brokenfoo.conf-works5c5

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。