正则表达式

2016-02-28更新

语法：（与perl兼容）默认是贪婪模式

/正则内容/

原子是正则表达式的最基本的组成单元，而且在每个模式中最少要包含一个原子。

原子是由所有那些未显示指定为元字符的打印（键盘输入的）和非打印字符(如回车未打印出来)组成，具体分为5类：

普通字符作为原子：如a~z、A~Z、0~9等，如：/3/、/a/
一些特殊字符和转义后元字符作为原子，语意特殊的符号需要转义(\)后才可作为原子，如：\”、\’、\*、\+、\?、\.等
一些非打印字符作为原子：

如：\f(换页符)、\n(换行符)、\r(回车符)、\t(制表符)、\v(垂直制表符)、

\cx(匹配由x指定的控制字符，如\cM匹配一个Control-M或回车符。x的值必须为A~Z或a~z之一)
使用“通用字符类型”作为原子：

如：

\d(任意一个数字，[0-9])、\D(任意一个非数字，如字母，空格等，[^0-9])

\w(任意一个字,a-z,A-Z,0-9,_，[a-zA-Z])、\W(任意一个非字，如@&*#()%@#，[^a-zA-Z])

\s(代表空白，空格，回车，制表符等，[\t\n\f\v])、\S(任意一个非空白，[^\t\n\f\v])

.：所有的原子
自定义原子表([])作为原子：[]：中括号表示里面的任意一个

如：

[abc]：a或b或c，一个字

[a-zA-Z]：a到z或A-Z的任意一个字符

^：除列表之外的：’/[apj]sp/‘、’/[^apj]sp/‘，必须放在开头

如：

如：

i：忽略大小写，”/a{5}/i”：五个a
m(multiline)：修正正则可以视为多行，在使用 ^ 或 $ 符号时，每一行满足都可以（即每一行均视为一行处理）与grep类似
s：扩充正则中的 . 可以匹配换行了。当未指定s的时候， . 无法匹配换行符号。
U(ungreedy)：将正则改成非贪婪的模式，遇到满足条件的，即匹配了。
（.* ，.+），在后面加个问号：.*?的方式，也可以实现非贪婪，推荐使用。两个同时使用，会翻转！
x(extended)：忽略正则中的空白，如：”/web server/x“匹配”web server webserver”时，变成了”webserver”，此时，能够匹配”webserver”，但是无法匹配”web server”。
e：替换之后，对字符串进行执行。比如替换之后，需要对匹配的字符串进行大小写转换。

正则的基本知识介绍完毕。下面介绍几个例子：

匹配身份证：\d{15}|\d{18}
匹配：URL：$reg = '/(https?|ftps?):\/\/(www|mail|bbs|ftp)\.(.*?)\.(com|net|org|cn)(([\w.\/]*)\??([\w.\=\&]*))?/';
email邮箱正则：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

注意：效率问题，尽量少用正则，尽量使用基本字符串函数。

查找：

分割：

替换：

其他正则函数：

preg_replace_callback($from,$call_back,$str)：从str中找到from匹配项，然后将匹配项作为参数传递给call_back函数，每一个子模式都会作为一个参数，第一个子模式，作为第一个参数。依次类推。
preg_filter：
preg_quote：转义正则表达式，即将正则中需要转义的字符，自动转义。

glob通配符：

*：任意多个任意字符匹配

?：仅与一个任意字符匹配

[…]：同方括号中的任意一个字符相匹配。这些字符可以用字符范围(比如 1-9)或者离散值或同时使用两者表示。例如：[a-zBE5-7] 同所有 a 到 z 之间的字符和 B、E、5、6、7 相匹配。

：与所有不在方括号中的某个字符匹配。例如 [!a-z] 同某个非小写字母相匹配[5]；

{c1,c2}：同c1或者c2相匹配。其中c1和c2也是通配符。因此，您可以使用{[0-9]*,[acr]}。如：*[!a-z]：当前目录中不以小写字符结尾的全部文件。