关于Python正则表达式 findall函数问题详解

 更新时间:2018年03月22日 16:26:58   投稿:wdc  
在写正则表达式的时候总会遇到不少的问题,本文讲述了Python正则表达式中 findall()函数和多个表达式元组相遇的时候会出现的问题

在写正则表达式的时候总会遇到不少的问题, 特别是在表达式有多个元组的时候。下面看下re模块下的findall()函数和多个表达式元组相遇的时候会出现什么样的坑。

代码如下:

import re
str="a b c d"
regex0=re.compile("((\w+)\s+\w+)")
print(regex0.findall(str))
regex1=re.compile("(\w+)\s+\w+")
print(regex1.findall(str))
regex2=re.compile("\w+\s+\w+")
print(regex2.findall(str))

结果:

[('a b', 'a'), ('c d', 'c')]
['a', 'c']
['a b', 'c d']

可能结果有点意外,下面解释一下

第一个正则表达式中是带有2个括号的,我们可以看到其输出是一个list 中包含2个 tuple

第二个正则表达式中带有1个括号,其输出的内容就是括号匹配到的内容,而不是整个表达式所匹配到的结果。

第三个正则表达式中不带有括号,其输出的内容就是整个表达式所匹配到的内容。

结论:findall()返回的是括号所匹配到的结果(如regex1),多个括号就会返回多个括号分别匹配到的结果(如regex),如果没有括号就返回就返回整条语句所匹配到的结果(如regex2)。所以在提取数据的时候就需要注意这个坑。

实际上是由其并不是python特有的,这是 正则 所特有的 , 任何一门高级语言使用正则都满足这个特点:有括号时只能匹配到括号中的内容,没有括号【相当于在最外层增加了一个括号】。在正则里面 “()” 代表的是分组的意思,一个括号代表一个分组,你只能匹配到"()"中的内容

相关文章

  • python实现京东订单推送到测试环境,提供便利操作示例

    python实现京东订单推送到测试环境,提供便利操作示例

    这篇文章主要介绍了python实现京东订单推送到测试环境,提供便利操作,涉及Python基于requests模块的网络请求操作相关使用技巧,需要的朋友可以参考下
    2019-08-08
  • Python使用Django实现博客系统完整版

    Python使用Django实现博客系统完整版

    这篇文章主要为大家详细介绍了Python利用Django完整的开发一个博客系统,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • python使用Matplotlib画条形图

    python使用Matplotlib画条形图

    这篇文章主要为大家详细介绍了python使用Matplotlib画条形图,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-09-09
  • 基于Python实现PDF区域文本提取工具

    基于Python实现PDF区域文本提取工具

    这篇文章主要为大家介绍了如何通过Python实现一个非常精简的图像化的PDF区域选择提取工具,文中示例代码讲解详细,感兴趣的小伙伴可以学习一下
    2021-12-12
  • Python学习之函数的定义与使用详解

    Python学习之函数的定义与使用详解

    函数是具有某种特定功能的代码块,可以重复使用(在前面数据类型相关章节。它使得我们的程序更加模块化,不需要编写大量重复的代码。本文将详细介绍Python中函数的定义与使用,感兴趣的可以学习一下
    2022-03-03
  • python deque模块简单使用代码实例

    python deque模块简单使用代码实例

    这篇文章主要介绍了python deque模块简单使用代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-03-03
  • Python实现获取系统临时目录及临时文件的方法示例

    Python实现获取系统临时目录及临时文件的方法示例

    这篇文章主要介绍了Python实现获取系统临时目录及临时文件的方法,结合实例形式分析了Python文件与目录操作相关函数与使用技巧,需要的朋友可以参考下
    2019-06-06
  • Django中QuerySet查询优化之prefetch_related详解

    Django中QuerySet查询优化之prefetch_related详解

    prefetch_related()和select_related()的设计目的很相似,都是为了减少SQL查询的数量,但是实现的方式不一样,下面这篇文章主要给大家介绍了关于Django中QuerySet查询优化之prefetch_related的相关资料,需要的朋友可以参考下
    2022-11-11
  • python正则爬取某段子网站前20页段子(request库)过程解析

    python正则爬取某段子网站前20页段子(request库)过程解析

    这篇文章主要介绍了python正则爬取某段子网站前20页段子(request库)过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Python Matplotlib绘制箱线图的全过程

    Python Matplotlib绘制箱线图的全过程

    又称箱形图(boxplot)或盒式图,数据大小、占比、趋势等等的呈现其包含一些统计学的均值、分位数、极值等等统计量,因此该图信息量较大,下面这篇文章主要给大家介绍了关于Python Matplotlib绘制箱线图的相关资料,需要的朋友可以参考下
    2021-09-09

最新评论