python——常用功能之文本处理

python——常用功能之文本处理

ID:8814914

大小:24.23 KB

页数:4页

时间:2018-04-08

python——常用功能之文本处理_第1页
python——常用功能之文本处理_第2页
python——常用功能之文本处理_第3页
python——常用功能之文本处理_第4页
资源描述:

《python——常用功能之文本处理》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、前言在生活、工作中,python一直都是一个好帮手。在python的众多功能中,我觉得文本处理是最常用的。下面是平常使用中的一些总结。环境是python3.30.基础在python中,使用str对象来保存字符串。str对象的建立很简单,使用单引号或双引号或3个单引号即可。例如:s='nice'#output:nices="nice"#output:nices="Let'sgo"#output:Let'sgos='"nice"'#output:"nice"s=str(1)#output:1s='''nice

2、day'''#output:nice#output:day 在python中,代表换行符,t代表tab键在python中,引用str中的某一段的内容很容易。例如:s='123456789's[0]#第一个字符:output:1s[-1]#倒数第一个字符:output:9s[:2]#前2个字符:output:12s[-2:]#后2个字符:output:89s[2:-2]#去掉前2个和后2个剩余的字符output:34567 在python中,判断某一字符串是否在另一个字符串中:'nice'in'nic

3、eday'#output:Truetask1. 按照某种格式生产字符串在python中,str对象有一个方法用于实现这种功能,这个方法是:str.format(*args,**kwargs)。例子:'1+2={0}'.format(1+2)#{0}是占位符,其中0表示是第一个需要被替换的。output:1+2=3'{0}:{1}'.format('nice','day')#{0},{1}是占位符,{0}指第一被替换,替换成nice,{1}第二个被替换,替换成day。output:nice:day实际用途:

4、我的手机拍照之后,手机的命名如下:IMG_20130812_145732.jpgIMG_20130812_144559.jpg在电脑中,会根据相片的日期放到不同的文件夹,文件夹命名如下:2013-08-102013-08-12所以说,要对相片的命名进行一个转换,这样才能映射到相应的文件夹转。代码如下:defgetName(name):return'{0}-{1}-{2}'.format(name[4:8],name[8:10],name[10:12])getName('IMG_20130812_14573

5、2.jpg')#output:2013-08-12task2.替换字符串中的某一部分 替换有2中方法,一种是使用str对象自带的方法replace(),另一种是使用re模块中sub(0的。例如:#replaces='niceday's.replace('nice','good')#s本身不改变,但会返回一个字符串:output:goodday#subimportres='cat1cat2cat3inthexxx're.sub('cat[0-9]','CAT',s)#s本身不改变,但会返回一个字符串:out

6、put:CATCATCATinthexxx对于re模块中的sub,需要了解正则表达式。task3.拆分字符串Excel可以到处逗号分隔符格式的文件。对于这样的字符串,我们可以把它拆成相应的字段。实现这个功能,主要使用str对象的自带方法split。例如:s='one,two,three's.split(',')#output:['one','two','three']task4.合并字符串除了拆分功能之外,我们可以将拆分好的字段合并成一个字符串。实现这个功能,主要使用str对象自带的方法join。例如:l

7、=['one','two','three']','.join(l)#output:one,two,three这个功能还可以在this模块中看到。task5.整合关于字符串的操作有很多。如果仅仅对一两行字符串进行操作,显示不出他的威力。在工作中,有可能会对文档进行处理,有的文档很大,手工的方式不好处理,这时,python就有用武之地。例如,从数据库中导出一个表table_1的数据,导出来的数据格式如下:insertintotable_1(field1,filed2,field3)values(value1,

8、value2,value3);...insertintotable_1(field1,filed2,field3)values(value1,value2,value3);数据生成的文件的大小大概为700M。要把这个表的数据导入到另一个数据库的表table_2中,table_1和table_2的表结构相同,仅仅是名字不同。这时,我们可以写一个python脚本,将table_1替换成table_2。例如:path_in='tab

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。