正则表达式的多行模式与单行模式图文分析
在Expresso中,测试“多行模式”
测试一
注意:这里样例文本中3eeeee后面没有回车,光标就在e的后面。匹配的结果是3eeeee,如上图的Search Results区中所示。
为什么这里不能匹配1abcde和2abc?
开启多行模式
^ 可以匹配字符串开头(字符串的开始位置),也可以匹配行的开头(即换行符\n之后的位置)
$ 可以匹配字符串结尾(字符串的结束位置), 也可以匹配行的结尾(即换行符\n之前的位置)
关闭多行模式
^ 只能匹配字符串开头
$ 只能匹配字符串结尾
知识点:\r为回车符,\n 为换行符。在windows中,我们平常说的换行,实质上是先回车,后换行;狼蚁网站SEO优化有更详细解说。
如上图所示:\r 匹配 [CR]、\n 匹配[LF] <—— CR为回车 LF为换行
字符串多个段落,比如
ab
cd
e
在windows操作系统中其实是:ab[CR][LF]cd[CR][LF]e
在windows中,文本中的回车换行储存为: 0D 0A。也就是说,先储存的是“回车\r”<CR>,再储存的是“换行\n”<LF>
CR用符号'\r'表示, ASCII代码是13, 十六进制为0x0D;
LF用符号'\n'表示, ASCII代码是10, 十六进制为0x0A;
正则表达式:(?m)^(\d\w+)(\s*)$
样例文本
匹配结果
在Expresso、PHP中,启用多行模式,"$" 匹配字符串结束位置或者 "\n" 之前的位置。
单行模式
开启单行模式: . 可以匹配任意字符(包括换行符)
关闭单行模式: . 只有匹配 非换行 的其它任意字符(.可匹配\r,即除了不匹配\n外的所有字符。)
多行模式 影响 ^ 和 $ 的匹配
单行模式 影响 . 的匹配
多行模式中必定包含 ^ 或 $ 或同时包含,否则即使加了 m,也没有任何意义
单行模式和多行模式是八杆子打不着的两个概念,只是因为正则发展的历史原因,造就了这样两个MS互斥的概念
单行模式影响的是小数点“.”的匹配范围
多行模式影响的是“^”和“$”的匹配范围
至于后面几个概念,全局匹配,多行模式和贪婪模式之间也没有什么必然联系
全局匹配关闭,只匹配首次成功匹配项,全局匹配开启,匹配所有成功匹配项
全局模式是一些脚本语言中才有的概念
在进行匹配时,关闭全局模式,类似于.NET中的Match方法,开启全局模式,类似于.NET中的Matches方法
在进行替换时,关闭全局模式,类似于Java中的replaceFirst,开启全局模式,类似于Java中的replaceAll
(在进行匹配时,关闭全局模式,类似于PHP中的preg_ match函数;开启全局模式,类似于PHP中的preg_ match_ all函数)