Python 正则表达式
Python 正则表达式
速查
1  | import sys  | 
匹配次数
1  | . 匹配任意字符一次  | 
常用语法
1  | re.S 匹配所有的字符  | 
常用功能
创建正则表达式对象
1  | compile(pattern[, flags])  | 
#根据包含正则表达式的字符串创建模式对象
全文查找符合表达式的对象
1  | search(pattern, string[, flags])  | 
从头开始查找符合表达式的对象
1  | match(pattern, string[, flags])  | 
分割字符串
1  | split(pattern, string[, maxsplit=0,flags])  | 
寻找所有符合表达式的对象
1  | findall(pattern, string,flags)  | 
替换字符串
1  | sub(pat,repl, string[,count=0,flags])  | 
注意 表 示 字 符 串 的 结 尾 , 所 以 加 上 表示字符串的结尾,所以加上 表示字符串的结尾,所以加上表示匹配的内容必须在字符串的结尾
匹配整个字符串还要加上字符串开始标记^
注意写爬出的时候可以用正则表达式匹配多个对象,然后遍历的时候使用yield生成器,可以组合成字典的形式,然后把字典给json.dumps()转换成json的格式,最后保存在本地文本中。
常规匹配的正则语法
1  | 汉字:[\u4e00-\u9fa5]{0,}  | 
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.




