欢迎来到天天文库
浏览记录
ID:13283963
大小:482.00 KB
页数:23页
时间:2018-07-21
《java正则表达式语法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、Java正则表达式表达式意义:1.字符x 字符x。例如a表示字符a\ 反斜线字符。在书写时要写为\\。(注意:因为java在第一次解析时,把\\解析成正则表达式\,在第二次解析时再解析为,所以凡是不是1.1列举到的转义字符,包括1.1的\,而又带有的都要写两次) n 带有八进制值0的字符n(0<=n<=7) nn 带有八进制值0的字符nn(0<=n<=7) mnn 带有八进制值0的字符mnn(0<=m<=3、0<=n<=7)xhh 带有十六进制值0x的字符hhuhhhh 带有十六进制值0x的字符hhhh
2、t 制表符('u0009') 新行(换行)符('u000A')r 回车符('u000D')f 换页符('u000C')a 报警(bell)符('u0007')e 转义符('u001B')cx 对应于x的控制符2.字符类[abc] a、b或c(简单类)。例如[egd]表示包含有字符e、g或d。[^abc] 任何字符,除了a、b或c(否定)。例如[^egd]表示不包含字符e、g或d。[a-zA-Z] a到z或A到Z,两头的字母包括在内(范围)[a-d[m-p]] a到d或m到p:[a-dm-p]
3、(并集)[a-z&&[def]] d、e或f(交集)[a-z&&[^bc]] a到z,除了b和c:[ad-z](减去)[a-z&&[^m-p]] a到z,而非m到p:[a-lq-z](减去)3.预定义字符类(注意反斜杠要写两次,例如d写为\d)任何字符(与行结束符可能匹配也可能不匹配)d 数字:[0-9]D 非数字:[^0-9]s 空白字符:[tx0Bfr]S 非空白字符:[^s]w 单词字符:[a-zA-Z_0-9]W 非单词字符:[^w]4.POSIX字符类(仅US-ASCII)(注意反斜
4、杠要写两次,例如p{Lower}写为\p{Lower})p{Lower} 小写字母字符:[a-z]。p{Upper} 大写字母字符:[A-Z]p{ASCII} 所有ASCII:[x00-x7F]p{Alpha} 字母字符:[p{Lower}p{Upper}]p{Digit} 十进制数字:[0-9]p{Alnum} 字母数字字符:[p{Alpha}p{Digit}]p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>?@[]^_`{
5、}~p{Graph} 可见字符:[p{Alnu
6、m}p{Punct}]p{Print} 可打印字符:[p{Graph}x20]p{Blank} 空格或制表符:[t]p{Cntrl} 控制字符:[x00-x1Fx7F]p{XDigit} 十六进制数字:[0-9a-fA-F]p{Space} 空白字符:[tx0Bfr]5.java.lang.Character类(简单的java字符类型)p{javaLowerCase} 等效于java.lang.Character.isLowerCase()p{javaUpperCase} 等效于java.la
7、ng.Character.isUpperCase()p{javaWhitespace} 等效于java.lang.Character.isWhitespace()p{javaMirrored} 等效于java.lang.Character.isMirrored()6.Unicode块和类别的类p{InGreek} Greek块(简单块)中的字符p{Lu} 大写字母(简单类别)p{Sc} 货币符号P{InGreek} 所有字符,Greek块中的除外(否定)[p{L}&&[^p{Lu}]] 所有字母,大写字母除外(减去)
8、7.边界匹配器^ 行的开头,请在正则表达式的开始处使用^。例如:^(abc)表示以abc开头的字符串。注意编译的时候要设置参数MULTILINE,如Patternp=Pattern.compile(regex,Pattern.MULTILINE);$ 行的结尾,请在正则表达式的结束处使用。例如:(^bca).*(abc$)表示以bca开头以abc结尾的行。b 单词边界。例如b(abc)表示单词的开始或结束包含有abc,(abcjj、jjabc都可以匹配)B 非单词边界。例如B(abc)表示单词的中间包含有abc,(jjabcjj匹配而j
9、jabc、abcjj不匹配)A
此文档下载收益归作者所有