Python正则表达式
的有关信息介绍如下:正则表达式在Python中通过import re模块使用,最早在python 1.5版本已经加入.下文主要通过实例介绍正则表达式用法.
正则表达式常用的元字符如下所示:
.:匹配任何一个字符;
^:匹配除去所列首个字符外的所有字符;
$:匹配字符串的尾部字符
*:表示匹配0个或者多个字符
+:表示匹配1个或者多个字符
?:表示匹配0个或者1个字符,如图中用例所示:
*?,+?,??:匹配满足要求的最短字符串;
{m}:匹配m个相同的字符;
{m,n}:匹配m到n个相同的字符;
{m,n}?:匹配m到n个相同的字符(非贪婪算法,匹配最短字符);
\:转义字符,如果字符串不用r限定,遇到特殊字符需要进行转义;
[]:满足匹配字符串的集合;
|:如A|B,或的关系,满足A或者B,表达式都为真;
(?=...):如果字符串后面的字符和...相匹配,则整个表达式返回真,否则失败;
(?!...):和前者相反,如果字符串后面的字符和...不匹配,则整个表达式返回真
(?<=...):如果在字符串找到和()后面相同的字符,继续回退字符看是否和<=后面的字符是否一样,如是则表达式返回真.
(?!=...):如果在字符串找到和()后面相同的字符,继续回退字符看是否和<=后面的字符是否一样,如是则表达式返回失败.
\number:反斜杠后面加数据,匹配number个字符串个数.
\A:匹配字符串开始;
\b:匹配空格字符;
\B:匹配除了空格字符以外的字符;
\d:匹配任意数字;
\D:匹配除了数字以外的字符;
\w:匹配字符和下划线;
\W:匹配除了字符和下划线以外的字符.