正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE),又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法,是计算机科学的一个概念。正则表达式,顾名思义即符合一定规则的表达式,就是用于匹配字符串中字符组合的模式。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本(字符串)。
字符串是在编程中涉及较多的一种数据结构,所以对字符串的操作也是各式各样,而且形式多变。那么,如何快速、方便地处理字符串就是重中之重。
例如,要判断用户输入的E-mail地址是否合法,不使用正则表达式来判断的话,可以通过自定义一个函数提取“@”关键字,然后分割其前后的字符串再分别判断是否合法等步骤来判断。又例如在各大网站注册用户时常看到的对用户名的要求(例如:6~18个字符,可使用字母、数字、下划线,需以字母开头),如果不是用正则表达式来判断,那么就要写一堆麻烦的代码来判断用户输入的用户名是否合法。这样的代码不但冗长,不能一目了然,而且还难以重复利用。如果要应对多变的需求的话,就更不方便维护了。(www.xing528.com)
但是有了正则表达式,这样的工作便简单多了。正则表达式正是为这种匹配判断文本类型的工作而诞生的。
正则表达式的设计思想就是使用一些描述性的符号和文字为字符串定义一个规则,凡是符合这个规则的,程序就认为文本是“匹配”的,否则就认为文本是“不匹配”的。通俗地讲,正则表达式的匹配过程就是逐字匹配表达式的描述规则,如果每个字符都匹配,那么程序就认为匹配成功,只要有一个匹配不成功,那么匹配就失败。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。