09 文本处理工具.ppt

09 文本处理工具.ppt

ID:48890987

大小:889.50 KB

页数:19页

时间:2020-01-28

09 文本处理工具.ppt_第1页
09 文本处理工具.ppt_第2页
09 文本处理工具.ppt_第3页
09 文本处理工具.ppt_第4页
09 文本处理工具.ppt_第5页
资源描述:

《09 文本处理工具.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、红帽企业Linux用户基础RHA030文本处理工具8单元红帽企业Linux用户基础目标本单元你将学习到:使用工具提取、分析和操作文本数据提取文本工具文件内容:less和cat文件摘选:head和tail提取列或者字段:cut按关键字提取:grep查看文件内容-less和catcat:dump一个或者多个文件到标准输出多个文件联合在一起Less:在查看文件或者标准输入的时候,每次只看一页在查看时常用的命令如下:/text:搜索textn/N:跳转到next/previous匹配的地方v:用文本编辑器打开该文件man命令中是采用less来分页的查看文件摘选-head和

2、tailhead:显示文件的起始10行使用-n选项改变行显示tail:显示文件最后10行使用-n选项改变行显示使用-f选项来继续从输入文件复制额外的单元对于监控日志文件非常有用!通过关键字来提取文本-grep打印匹配的文件行或者标准输入$grep‘john’/etc/passwd$date–help

3、grepyear使用-i选项:忽略大小写敏感搜索使用-n选项:打印匹配的行号使用-v选项:打印哪些不匹配的行使用-AX选项:在匹配数据后包含显示X行使用-BX选项:在匹配数据前包含显示X行使用-r选项:递归搜索目录使用--color=auto选项:用color颜色高亮

4、显示匹配的数据提取列或字段-cut显示文件指定的列或者标准输入数据$cut-d:-f1/etc/passwdgreproot/etc/passwd

5、cut-d:-f7使用-d选项来指定列分隔符(默认是TAB)使用-f选项来指定要打印的列使用-c选项来指定按字符来提取$cut–c2-5/usr/share/dict/words文本分析工具文本统计:wc文本排序:sort文件比较:diff和patch拼写检查:aspell收集文本统计-wc(单词统计)计算单词数,行数,字节数和字符数可以针对一个文件或者标准输入$wcstory.txt392371901story.tx

6、t使用-l选项:仅仅统计行数使用-w选项:仅仅统计单词数使用-c选项:仅仅统计字节数使用-m选项:统计字符数(不显示)文本排序-sort对标准输出排序-原始文件不改变$sort[options]file(s)常用选项-r:执行反向(降)排序-n:执行数字排序-f:忽略字符串中的大小写-u:在输出中删除重复的行(唯一)-tc:使用c作为字段间的分隔符kX:使用c分隔符排序X字段可多次使用消除重复行-sort和uniqsort-u:从输入删除重复行uniq:从相邻的行中删除重复行使用-c选项统计发生重复的次数跟sort一起使用效果最好:$sortuserlist.tx

7、t!uniq-c文件比较-diff比较两个文件的不同$difffoo.conf-brokenfoo.conf-works5c5use_widgets=yes指出差异在第5行使用图形化的diff工具gvimdiff,在vim-x11包里复制文件更改-patchdiff命令输出差异并保存在patchfile文件中使用-u选项统一diff,对生成patchfile是有好处的patch命令复制改变在其它的文件中(小心使用!)使用-b选项自动备份变更的文件diff-ufoo.conf-brokenfoo.conf-works>foo.p

8、atchpatch-bfoo.conf-brokenfoo.patch使用aspell做拼写检查交互式拼写检查文件:$aspellcheckletter.txt非交互式列出拼错的单词$aspelllist

9、wc-l文本操作工具-tr和sed更改(转变)字符:tr转换一种字符集合为另外一种字符集合只能从STDIN读取数据$tr‘a-z’‘A-Z’

10、sed技巧sed‘s/dog/cat/g’petssed‘1,50s/dog/cat/g’petssed‘/digby/,/duncan/s/dog/cat/g’pets多路sed指令sed–e‘s/dog/cat/’–e‘s/hi/lo/’petssed–fmyeditspets复杂的查询-正则表达式^表示行的开始$表示行的结束在bash中做为字符类[abc],[^abc][[:upper:]],[^[:upper:]]被许多命令使用:grep,sed,less…总结和实验摘要和实验提取文本cat,less,head,tail,grep,cut文本分析wc,so

11、rt,un

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。