资源描述:
《c#正则表达式基础》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、C#正则表达式基础对于初学者看到类似“w+@w+.w{1,3}”这样复杂没有规律的字符,就会莫名产生一种恐惧感。其实正则表达式和字符串(String)的使用同样非常简单。下面让我们逐步地走进正则表达式的世界!1、什么是正则表达式正则表达式是用来检验和操作字符串的强大工具。简单的理解正则表达式可以认为是一种特殊的验证字符串。正则表达式常见运用是验证用户输入信息格式,比如上面的那组“w{1,}@w{1,}.w{1”,实际上就是验证邮件地址是否合法的;当然正则表达式不仅仅是用于验证,可以说只要运用字符串的地方都可以使用正则表达式;2、涉及的基本的类正则表达式在
2、英文中写作(RegularExpression),根据正则表达式的使用范围和单词意思,.NET将其命名空间设置为System.Text.RegularExpressions;在该命名空间内包括了8个基本的类:Capture、CaptureCollection、Group、GroupCollection、Match、MatchCollection、Regex和RegexCompilationInfo如图1所示;图1MSDNLibrary中正则表达式命名空间其中:(1)Capture用于单个表达式捕获结果(2)CaptureCollection用于一个序列进行字符串捕获(3
3、)Group表示单个捕获的结果(4)GroupCollection表示捕获组的集会(5)Match表示匹配单个正则表达式结果(6)MatchCollection表示通过迭代方式应用正则表达式到字符串中(7)Regex表示不可变的正则表达式(8)RegexCompilationInfo将编译正则表达式需要提供信息3、正则表达式基础知识基本语法在正则表达式中拥有一套自己的语法规则,常见语法包括;字符匹配、重复匹配、字符定位、转义匹配和其他高级语法(字符分组、字符替换和字符决策);3.1、字符匹配语法:字符语法语法解释语法例子d匹配数字(0~9)‘d’匹配8,不匹配12;
4、D匹配非数字‘D’匹配c,不匹配3;w匹配任意单字符‘ww’匹配A3,不匹配@3;W匹配非单字符‘W’匹配@,不匹配c;s匹配空白字符‘dsd’匹配3d,不匹配abc;S匹配非空字符‘SSS’匹配A#4,不匹配3d;.匹配任意字符‘....’匹配A$5,不匹配换行;[…]匹配括号中任意字符[b-d]匹配b、c、d,不匹配e;[^…]匹配非括号字符[^b-z]匹配a,不匹配b-z的字符;3.2、重复匹配语法:重复语法语法解释语法例子{n}匹配n次字符d{3}匹配ddd,不匹配dd或dddd{n,}匹配n次和n次以上w{2
5、}匹配ww和www以上,不匹配w{n,m}匹配n次上m次下s{1,3}匹配s,ss,sss,不匹配ssss?匹配0或1次5?匹配5或0,不匹配非5和0+匹配一次或多次S+匹配一个以上S,不匹配非一个以上S*匹配0次以上W*匹配0以上W,不匹配非N*W3.3、字符定位语法:重复语法语法解释语法例子^定位后面模式开始位置$前面模式位于字符串末端A前面模式开始位置z前面模式结束位置Z前面模式结束位置(换行前)b匹配一个单词边界B匹配一个非单词边界3.4、转义匹配语法:转义语法涉及字符(语法解释)语法例子“”+实际字符
6、.*+?
7、(){}^$\匹配字符“”匹配换行r匹配回车t匹配水平制表符v匹配垂直制表符f匹配换页nn匹配一个8进制ASCIIxnn匹配一个16进制ASCIIunnnn匹配4个16进制的Uniodec+大写字母匹配Ctrl-大写字母cS-匹配Ctrl+S4、构造正则表达的方法构造正则表达式需要涉及Regex类,在Regex类中包括:IsMatch()、Replace()、Split()和Match的类;(1)IsMatch()方法;IsMatch()方法实际上是一个返回Bool值得方法,如果测试字符满足正则表达式返回True否则返回False;
8、例1:判断是非成都地区电话号码合法;分析:成都地区电话号码组成028********,前面为固定区号028,后面满足8位数字;设计正则表达式:028d{8}(解释:028区号固定,后面为8个数字d组成);程序代码,如图2所示:图2“例1”IsMatch方法是用例(2)Replace()方法;Replace()方法实际上是一种替换的方法,替换匹配正则表达式匹配模式;例2:在发布带有公开电子邮件地址的文章时,替换@位AT避免产生垃圾邮件;分析:首先需要判断文章中电子邮箱地址,然后执行替换设计正则表达式:判断电子邮箱表达式”w{1,}@w