一 正则表达式:

 

正则表达式(或称Regular Expression,简称RE)就是由普通字符(例如字符 a z)以及特殊字符(称为元字符)组成的文字模式。

 

该模式描述在查找文字主体时待匹配的一个或多个字符串。

 

正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。简单的说,正则表示式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为, 正则表示式通过一些特殊符号的辅助,可以让使用者轻易的达到搜寻/删除/取代某特定字符串的处理程序。vimgrepfindawksed等命令都支持正则表达式。

常用正则表达式:

1.代表任意单个字符, 如:/l..e/与包含一个l,后跟两个字符,然后跟一个e的行相匹配

 

2^代表行的开始。 ^love 如:与所有love开头的行匹配

 

3$代表行的结束。love$ 如:与所有love结尾的行匹配

那么‘^$’ 就表示空行

 

4[]匹配括号中的字符之一

[abc]     匹配单个字符abc

[123]     匹配单个字符123

[a-z]     匹配小写字母a-z之一

[a-zA-Z]    匹配任意英文字母之一

[0-9a-zA-Z]匹配任意英文字母或数字之一

注意:上面标红色的单个和之一,不管[]里面多复杂,它的结果都是一个字符!

 

可以用^标记做[]内的前缀,表示[]内的字符之外的其他字符(即匹配不在此括号中的任何字符)。比如 搜索oo前没有g的字符串的行. 应用 '[^g]oo' 作搜索字符串,^符号如果出现[]的起始位置表示否定,但是[]的其他位置是普通字符。[^ab^c] 除了a或b或^或c的其他任意单个字符

 

5* 用于修饰前导字符,表示前导字符出现0或任意多

如:'a*grep'匹配所有0个或多个a后紧跟grep的行。.*”表示任意字符串

 

6\? 用于修饰前导字符,表示前导字符出现01

a\? 匹配01a

 

7\+ 用于修饰前导字符,表示前导字符出现1或多

a\+ 匹配1或多个a

 

8\{

n,m\} 用于修饰前导字符,表示前导字符出现nm nm都是整数,且n<m

a\{3,5\} 匹配35个连续的a

 

\{

n,m\}还有其他几种形式:

\{

n\} 连续的n前导字符

\{

n,\} 连续的至少n前导字符

9\ 用于转义紧跟其后的单个特殊字符,使该特殊字符成为普通字符

 

如:^\.[0-9][0-9] 以一个句点和两个数字开始

 

 

例如:

a* 匹配连续的任意(也包括0)个a

a\? 匹配01a

a\+ 匹配1或多个a

a\{3,5\} 匹配35个连续的a

\.* 匹配0或多个连续的. \.表示普通字符句点

 

10|表示  如: a|b|c 匹配abc。如:grep|sed匹配grepsed

 

11(),将部分内容合成一个单位组,比如 要搜索 glad good 可以如下 'g(la|oo)d'

 

综合举例1

1 Christian Scott lives here and will put on a Christmas party.

2 There are around 30 to 35 people invited.

3 They are:

4  Tom

5 Dan

6  Rhonda Savage

7 Nicky and Kimerly.

8 Steve, Suzanne, Ginger and Larry.

^[A-Z]..$

搜索行以AZ的一个字母开头,然后跟两个任意字母,然后跟一个换行符的行。将找到第5行。

 

^[A-Z][a-z]*3[0-5]

搜索以一个大写字母开头,后跟0个或多个小写字母,再跟数字3,再跟05之间的一个数字。无法找到匹配行(改成^[A-Z][a-z]*.*3[0-5]可找到第2)

 

^ *[A-Z][a-z][a-z]$

搜索以0个或多个空格开头,跟一个大写字母,两个小写字母和一个换车符。将找到第4行的TOM(整行匹配)和第5行。注意,*前面有一个空格

 

^[A-Za-z]*[^,][A-Za-z]*$

将查找以0个或多个大写或小写字母开头,不跟逗号,然后跟0个或多个大写或小写字母,然后跟一个换车符。将找到第45行。

 

综合举例2

# ls -l  /bin | grep   '^...s'

上面的命令是用来查找suid文件的;

# ls -lR /usr | grep   '^...s..s'

上面的命令是用来查找suidguid的。