十分钟上手正则表达式上篇-CFANZ编程社区

正则表达式(regular expression)描述了一种字符串匹配的模式（pattern），可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等

一、正则表达式的定义：

正则表达式是你所定义的模式模板（ pattern template ）， Linux 工具可以用它来过滤文本。 Linux工具（比如sed 编辑器或 gawk 程序）能够在处理数据时使用正则表达式对数据进行模式匹配。如果数据匹配模式，它就会被接受并进一步处理；如果数据不匹配模式，它就会被滤掉。

正则表达式模式匹配数据：

十分钟上手正则表达式上篇_数据

正则表达式模式利用通配符来描述数据流中的一个或多个字符。 Linux 中有很多场景都可以使用通配符来描述不确定的数据。【*】号在我们工作中就比较常用。

十分钟上手正则表达式上篇_linux_02

示例说明：

a.*参数会让ls命令只列出名字以a开头的文件。文件名中a之后可以有任意多个字符（包括什么也没有）。ls命令会读取目录中所有文件的信息，但只显示跟通配符匹配的文件的信息。

二、正则表达式的类型

使用正则表达式最大的问题在于有不止一种类型的正则表达式。 Linux 中的不同应用程序可能会用不同类型的正则表达式。这其中包括编程语言（Java 、 Perl 和 Python ）、 Linux 实用工具（比如sed 编辑器、 gawk 程序和 grep 工具）以及主流应用（比如 MySQL 和 PostgreSQL 数据库服务器）。正则表达式是通过正则表达式引擎（ regular expression engine ）实现的。正则表达式引擎是一套底层软件，负责解释正则表达式模式并使用这些模式进行文本匹配。

两种流行的正则表达式引擎：