正则表达式语言元素

正则表达式语言元素

ID:15640175

大小:243.00 KB

页数:26页

时间:2018-08-04

正则表达式语言元素_第1页
正则表达式语言元素_第2页
正则表达式语言元素_第3页
正则表达式语言元素_第4页
正则表达式语言元素_第5页
资源描述:

《正则表达式语言元素》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、正则表达式.NETFrameworkSDK提供了大量的正则表达式工具,使您能够高效地创建、比较和修改字符串,以及迅速地分析大量文本和数据以搜索、移除和替换文本模式。下面详细介绍可用于定义正则表达式的字符、运算符和构造。字符转义大多数重要的正则表达式语言运算符都是非转义的单个字符。转义符(单个反斜杠)通知正则表达式分析器反斜杠后面的字符不是运算符。例如,分析器将星号(*)视为重复限定符,而将后跟星号的反斜杠(*)视为Unicode字符002A。下面列出的字符转义在正则表达式和替换模式中都会被识别。转义符【一般字符】,说

2、明:除.$^{[(

3、)*+?外,其他字符与自身匹配。转义符【a】,说明:与响铃(警报)u0007匹配。转义符【b】,说明:如果在[]字符类中,则与退格符u0008匹配;如果不是这种情况,请参见本表后面的“注意”部分。转义符【t】,说明:与Tab符u0009匹配。转义符【r】,说明:与回车符u000D匹配。转义符【v】,说明:与垂直Tab符u000B匹配。转义符【f】,说明:与换页符u000C匹配。转义符【】,说明:与换行符u000A匹配。转义符【e】,说明:与Esc符u001B匹配。转

4、义符【40】,说明:将ASCII字符匹配为八进制数(最多三位);如果没有前导零的数字只有一位数或者与捕获组号相对应,则该数字为后向引用。(有关更多信息,请参见反向引用。)例如,字符40表示空格。转义符【x20】,说明:使用十六进制表示形式(恰好两位)与ASCII字符匹配。转义符【cC】,说明:与ASCII控制字符匹配;例如,cC为Ctrl-C。转义符【u0020】,说明:使用十六进制表示形式(恰好四位)与Unicode字符匹配。注意:.NETFramework不支持用于指定Unicode的Perl5字符转

5、义。Perl5字符转义的格式是x{####…},其中“####…”是十六进制数字的序列。应改为使用本行中描述的.NETFramework字符转义。转义符【】,说明:在后面带有不识别为转义符的字符时,与该字符匹配。例如,*与x2A相同。注意:转义字符b是一个特例。在正则表达式中,b表示单词边界(在w和W之间),不过,在[]字符类中,b表示退格符。在替换模式中,b始终表示退格符。替换只在替换模式中允许替换。对于正则表达式中的类似功能,使用后向引用(如1)。有关后向引用的详细信息,请参见反向引用和后向引用

6、构造。字符转义和替换是在替换模式中识别的唯一的特殊构造。下面几部分描述的所有语法构造只允许出现在正则表达式中;替换模式中不识别它们。例如,替换模式a*${txt}b会插入字符串“a*”,该字符串后跟按txt捕获组匹配的子字符串,该子字符串后跟字符串“b”(如果有)。在替换模式中,*字符不会识别为元字符。与此类似,在正则表达式匹配模式中不识别$模式。在正则表达式中,$指定字符串的结尾。下面显示如何定义命名并编号的替换模式。字符【$数字】,说明:替换按组号number(十进制)匹配的最后一个子字符串。字符【${name}】,

7、说明:替换由(?)组匹配的最后一个子字符串。字符【$$】,说明:替换单个“$”字符。字符【$&】,说明:替换完全匹配本身的一个副本。字符【$`】,说明:替换匹配前的输入字符串的所有文本。字符【$'】,说明:替换匹配后的输入字符串的所有文本。字符【$+】,说明:替换最后捕获的组。字符【$_】,说明:替换整个输入字符串。字符类字符类表示一组可以匹配输入字符串的字符。组合原义字符、转义符和字符类以构成正则表达式模式。字符类将定义字符集。一些字符类等同于一个或多个Unicode通用类别值或Unicode块。Unico

8、de通用类别定义了字符的主要分类,即字符的类型是否为字母、十进制数字、分隔符、数学符号、标点符号,等等。例如,Lu通用类别表示“字母,小写”,Sm类别表示“符号,数学”。有关更多信息,请参见支持的Unicode通用类别。Unicode块是Unicode码位的命名范围。.NETFramework提供一组从Unicode块名称派生的命名块。例如,.NETFramework提供IsBasicLatin命名块,其对应于BasicLatinUnicode块并且包含U+0000至U+007F范围内的字符。有关更多信息,请参见支持的命

9、名块。.NETFramework支持字符类减法表达式,通过该表达式可以定义一组字符作为从一个字符类中排除另一字符类的结果。有关更多信息,请参见字符类。字符类语法下面总结了字符类及其语法。字符类[character_group],说明:(正字符分组。)匹配指定字符分组内的任何字符。字符分组由串连的一个或多个原义字符、转

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。