正则表达式(Regular Expression,简称 RegEx)是一种强大的文本匹配工具,广泛应用于字符串搜索、替换和验证等场景。
1. 基本概念
1.1 创建正则表达式
在 JavaScript 中,可以通过两种方式创建正则表达式:
-
字面量表示法:
const regex = /pattern/flags; -
构造函数表示法:
const regex = new RegExp('pattern', 'flags');
1.2 常用标志
g:全局匹配,查找所有匹配项,而不是在第一个匹配项后停止。i:忽略大小写。m:多行模式,改变^和$的行为,使其匹配每一行的开头和结尾,而不仅仅是整个字符串的开头和结尾。u:Unicode 模式,使正则表达式能够正确处理 Unicode 字符。y:粘连模式,从目标字符串的当前位置开始匹配。
2. 基本元字符
2.1 匹配单个字符
.:匹配除换行符以外的任何单个字符。\w:匹配任何字母数字字符及下划线,等同于[A-Za-z0-9_]。\W:匹配任何非字母数字字符及下划线,等同于[^A-Za-z0-9_]。\d:匹配任何数字,等同于[0-9]。\D:匹配任何非数字,等同于[^0-9]。\s:匹配任何空白字符,包括空格、制表符、换页符等。\S:匹配任何非空白字符。[abc]:匹配方括号内的任意一个字符。[^abc]:匹配不在方括号内的任意一个字符。
2.2 重复匹配
*:匹配前面的子表达式零次或多次。+:匹配前面的子表达式一次或多次。?:匹配前面的子表达式零次或一次。{n}:匹配前面的子表达式恰好 n 次。{n,}:匹配前面的子表达式至少 n 次。{n,m}:匹配前面的子表达式至少 n 次,最多 m 次。
2.3 锚定
^:匹配输入字符串的开始位置。$:匹配输入字符串的结束位置。\b:匹配单词边界。\B:匹配非单词边界。
2.4 分组和引用
():分组,用于捕获匹配的子字符串。(?:...)










