欢迎来到天天文库
浏览记录
ID:52767989
大小:360.80 KB
页数:3页
时间:2020-03-30
《集算器文本处理之批量替换.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、集算器文本处理之批量替换在进行文本处理时,有时候需要根据配置文件替换源文件中的多组字符串。命令行可以替换单组字符串,但难以进行批量替换,高级语言当然可以完成这项工作,但需要编写复杂的多层循环,如果源文件太大而无法放入内存,则处理起来会更加困难。集算器支持迭代函数自动处理循环,并提供游标读取大文件,易于实现批量替换,下面通过例子来看一下具体作法。配置文件condition.txt有两列,以tab为分割符,列befor表示被替换的字符串,列after表示替换后的字符串,现在要根据该配置文件对source.txt进行批量替换,最后将替换
2、的结果写入result.txt。文件condition.txt的部分数据如下(第一行是列名):beforeafteresProcesCalcTextSpreadsheettextspreadsheetProcessingComputingprocessingcomputingprocesscomputeProcessComputeexamplecaseExampleCasecodescriptCodeScript…源文件source.txt的部分内容如下:esProcImprovesTextProcessing–Condition
3、alQueryonBigFilesDuringtextprocessing,youoftenhavethetasksofqueryingdatafromabigfileononeormoreconditions.Commandlinegrepcatcommandcanbeusedtohandlesomesimplesituationswithsimplecommandyetlowefficiency.Orhigh-levellanguagescanbeusedtogetamuchhigherefficiencywithcompl
4、icatedcode.Ifthequeryconditionsarecomplexordynamic,youneedtocreateanadditionalSQL-likelow-levelclasslibrary,whichincreasesthecomplexityofthecomputation.esProcsupportsperformingconditionalqueryonbigfilesandmultithreadedparallelcomputing,anditscodeforhandlingthiskindofp
5、roblemisbothconciseandefficient.ThefollowingexamplewillteachyoutheesProcmethodofdoingthejob.…集算器代码:A1=file("e:\condition.txt").import@t()2=file("e:\source.txt").read()3=A1.loops(replace(~~,before,after);A2)4=file("e:\result.txt").export(A3)A1=file("e:\condition.tx
6、t").import@t()这句代码用来读取配置文件。函数import可将文本文件或二进制文件读成二维表(序表),默认的列分割符是tab,选项@t表示将第一行读为列名。A1的计算结果如下:A2=file("e:\source.txt").read()这句代码用来读取源文件。函数read可将文本文件读成一个大字符串。A2的计算结果如下:A3=A1.loops(replace(~~,before,after);A2)这句代码用来按照A1批量替换A2里的字符串。函数loops是迭代函数,可以对一个集合(比如记录的集合A1)进行循环计算
7、,依次取出集合中的成员,按照指定的表达式进行计算(比如replace(~~,before,after)),计算的结果可以参与下一次计算(符号~~表示上一次的计算结果),直到循环完整个集合。A2是函数loops的初始值。函数replace用来进行字符串替换,有三个参数:源字符串、被替换的字符串、替换后的字符串,分别是~~、before、after。这里的before和after是序表A1中的列名(字段名)。替换的过程其实只有A3这一句,下面把替换结果写入文件,如下:A4=file("e:\result.txt").write(A3
8、),这里的函数write可以将字符串写入文件。A1-A4还可以简化如下:A1=file("e:\condition.txt").import@t().loops(replace(~~,before,after);file("e:\source.
此文档下载收益归作者所有