Python中re模块主要功能是通过正则表达式是用来匹配处理字符串的

re模块是python独有的匹配字符串的模块,该模块中提供的很多功能是基于正则表达式实现的,而正则表达式是对字符串进行模糊匹配,提取自己需要的字符串部分,他对所有的语言都通用。注意:

  • re模块是python独有的
  • 正则表达式所有编程语言都可以使用
  • re模块、正则表达式是对字符串进行操

1. re.match

设定一个字符串

content = '2005-2018 douban.com, all rights reserved 北京豆网科技有限公司'

  • 常规匹配

result = re.match('2005-\d{4}\s\w{6}\W\w{3}\W{2}\w{3}\s\w{6}\s\w{8}\s.*司$', content) print(result.group())

输出结果

> 2005-2018 douban.com, all rights reserved 北京豆网科技有限公司

  • 泛匹配

result = re.match('^2005.*司$', content) print(result.group())

输出结果

> 2005-2018 douban.com, all rights reserved 北京豆网科技有限公司

  • 标匹配(括号及group的用法)

content = '2005-2018 douban.com, all rights reserved 北京豆网科技有限公司' result = re.match('^(\d{4})-(\d{4}).*司$', content) print(result.group()) print(result.group(1)) print(result.groups(), type(result.groups())) print(result.group(2))

输出结果

> 2005-2018 douban.com, all rights reserved 北京豆网科技有限公司> 2005> ('2005', '2018') > 2018