正则表达式的“ REGEX”缩写在通过使用一种或多种匹配的特定搜索模式(ASCII或Unicode字符)从任何文本中提取信息时非常有用。
正则表达式在许多应用中使用,从Web抓取,将数据转换为其他格式,验证到解析/替换字符串。
该工具与几乎所有编程语言兼容,包括JavaScript,Java,VB,C#,C / C ++,Python等。
锚点-^和$
^ | 此符号表示字符串的开头 |
$ | 该符号表示字符串的结尾 |
量词-* +?和{}
符号“ *”,“ +”和“?”表示一个字符或一个字符序列可能出现的次数。它们的含义是:“零或多个”,“一个或多个”和“零或一个”。
您还可以使用边界,边界出现在括号{}内,并指示出现次数的范围:
* | 匹配0个或多个前一个字符(例如ab * c将生成“ ac”,“ abc”,“ abbc”等输出。 |
? | 匹配上一个字符的0或1 |
+ | 匹配1个或多个前一个字符 |
{X} | 精确匹配x次 |
{x,y} | 匹配x,y字符之间的所有字符 |
OR运算符-| 要么 []
| | 匹配任一侧的一个字符或一组字符(例如a | b对应于a或b) |
[] | 这与以前完全一样 |
字符类-\ d \ w \ s和。
\ d | 匹配一位 |
\ D | 执行\ d的逆向匹配 |
\ w | 匹配单词字符 |
\ W | 执行\ w的逆向匹配 |
\ s | 匹配空白字符 |
\ S | 执行\ s的逆向匹配 |
。 | 匹配任何字符*。因此称为通配符; *换行符(/ n)除外。 |