Python正则表达式有哪些

　　python正则表达式简单使用,

　　元字符

　　1.匹配元字符：

　　. 它匹配除了换行字符外的任何字符，在 alternate 模式(re.dotall)下它甚至可以匹配换行

　　^ 匹配行。除非设置 multiline 标志，它只是匹配字符串的开始。

　　$ 匹配行尾，行尾被定义为要么是字符串尾，要么是一个换行字符后面的任何位置。

　　[] 它们常用来指定一个字符类别，所谓字符类别就是你想匹配的一个字符集

　　\ 反斜杠后面可以加不同的字符以表示不同特殊意义。它也可以用于取消所有的元字符，这样你就可以在模式中匹配它们了

　　| 可选项，或者 "or" 操作符。

　　() 一般情况下表示一个记忆组 (remembered group)。你可以利用 re.search 函数返回对象的 groups() 函数获取它的值

　　2.重复元字符：

　　* 重复0或n次

　　+ 重复1或n次

　　? 重复0或1次

　　{m,n} 该限定符的意思是至少有 m 个重复，至多到 n 个重复

　　3.用 "\" 开始的预定义字符集

　　\d 匹配任何十进制数;它相当于类 [0-9]。

　　\d 匹配任何非数字字符;它相当于类 [^0-9]。

　　\s 匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。

　　\s 匹配任何非空白字符;它相当于类 [^\t\n\r\f\v]。

　　\w 匹配任何字母数字字符;它相当于类 [a-za-z0-9_]。

　　\w 匹配任何非字母数字字符;它相当于类 [^a-za-z0-9_]。

　　\a 只匹配字符串。当不在 multiline 模式，\a 和 ^ 实际上是一样的。然而，在 multiline 模式里它们是不同的;\a 只是匹配字符串，而 ^ 还可以匹配在换行符之后字符串的任何位置。

　　\z 只匹配字符串尾。

　　\b 单词边界。这是个零宽界定符(zero-width assertions)只用以匹配单词的词和词尾。单词被定义为一个字母数字序列，因此词尾就是用空白符或非字母数字符来标示的。

　　\b 另一个零宽界定符(zero-width assertions)，它正好同 \b 相反，只在当前位置不在单词边界时匹配。

　　注：[akm$]将匹配字符"a", "k", "m", 或 "$" 中的任意一个;"$"通常用作元字符，但在字符类别里，其特性被除去，恢复成普通字符。

　　regexobject(re)对象常用方法

　　matchobject=re.match(pattern,string,flag='0') ：决定 re 是否在字符串刚开始的位置匹配

　　matchobject=re.search(pattern,string,flag='0')：扫描字符串，找到这个 re 匹配的位置

　　tuple=re.findall(pattern,string,flag='0') ：找到 re 匹配的所有子串，并把它们作为一个列表返回

　　matchobjectlist=re.finditer(pattern,string)：找到 re 匹配的所有子串，并把它们作为一个迭代器返回

　　matchobject对象的常用方法

　　findstring = matchobject.group() ：返回被 re 匹配的字符串

　　i = matchobject.start() ：返回匹配开始的位置

　　i = matchobject.end() ：返回匹配结束的位置

　　start,end = matchobject.span() ：返回一个元组包含匹配 (开始,结束) 的位置

　　编译标志

　　dotall, s ：使 . 匹配包括换行在内的所有字符

　　ignorecase, i：使匹配对大小写不敏感

　　locale, l ：做本地化识别(locale-aware)匹配

　　multiline, m：多行匹配，影响 ^ 和 $

　　verbose, x ：能够使用 res 的 verbose 状态，使之被组织得更清晰易懂

　　使用心得

　　1.先编译后使用：re.compile('pattern')

　　2.切勿重复编译：放入全局空间或放入cell空间并实例出一个闭包实例

文中图片素材来源网络，如有侵权请联系删除

查看上一篇

查看下一篇

热门课程

相关头条

预约报名