正则表达式是用于描述字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找及替换操作。主要用于模糊匹配。
正则表达式与通配符的区别
正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep、awk、sed等命令可以支持正则表达式
通配符用来匹配符合条件的文件名,通配符是完全匹配。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符进行匹配
基础正则表达式
* | 前一个字符匹配0次或任意多次 |
. | 匹配除了换行符外任意一个字符 |
^ | 匹配行首。例如^hello 会匹配以hello开头的行 |
$ | 匹配行尾。例如hello$ 会匹配以hello结尾的行 |
[] | 匹配中括号中指定的任意一个字符,只匹配一个字符。[0-9]匹配任意一位数字 |
[^] | 匹配除中括号的字符以外的任意一个字符。 例如:[^0-9]匹配任意一位非数字字符 [^a-z]表示任意一位非小写字母 |
\ | 转义符。用于取消将特殊符号的含义取消 |
\{n\} |
表示其前面的字符恰好出现N次 例如: [0-9]\{4\} 匹配4位数字[1][3-8][0-9]\{9\} 匹配手机号码 |
\{n,\} |
表示其前面的字符出现不小于n次。 例如 [0-9]\{2,\} 表示两位及以上的数字 |
\{n,m\} |
表示其前面的字符至少出现n次,最多出现m次。 例如 [a-z]\{6,8\} 匹配6到8位的小写字母 |
|
|
|
|