python如何利用re模块正则表达式匹配ip地址

更新时间：2023年08月31日 10:05:25 作者：shanf7921

这篇文章主要介绍了python如何利用re模块正则表达式匹配ip地址问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

python中利用正则表达式判断ipv4地址是否合法

ip地址的范围为0.0.0.0-255.255.255.255，分成四段，则每段的范围都是0-255，因此，以一段进行分析：

在进行书写匹配规则时，可以将每段的取值分为4个区间。即0-99、100-199、200-249、250-255。

其正则匹配的表达式应为：

# 匹配 0-255的表达式书写方法pattern &#61; re.compile(r&#39;([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])&#39;)
# 匹配 0-255的表达式书写方法
pattern = re.compile(r'([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])')

以下作具体解释

0-99：[1-9]?\d

问号(?)表示匹配0或1次，此表达式可以匹配0-99内任意是数值。

100-199：1\d\d

第一位为1，第二位和第三位为0-9之间的任意数值。

200-249：2[0-4]\d

200-249范围内，第一位固定为2，第二位取值范围为[0-4]，第三位为0-9之间任意数字，使用’\d’进行匹配。

250-255：25[0-5]

250-255范围内，前两位固定为25，最后一位取值为[0-5]。

使用 | 符号，将四部分连接起来，即是一条完整的匹配0-255范围的表达式：([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])

此时应该已经能够理解，如何进行一段ip地址的匹配，再讲解如何匹配完整的ip地址。

简单理解就是(0-255).(0-255).(0-255).(0-255)。使用四段相同的表达式，并在四段表达式之间增加3个点(.)。

可将前三段ip值和三个点看作三部分，即每部分为(0-255).。

(0-255).的匹配表达式可书写为(([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])\.)，此表达式需要使用三次，因此可以写成 (([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])\.){3}

最终，匹配0.0.0.0-255.255.255.255的表达式如下所示：

# 匹配 0.0.0.0-255.255.255.255的表达式书写方法
pattern = re.compile(r'(([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])\.){3}([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])')

下面作几个测试用例（使用fullmatch）

In [1]: pattern.fullmatch('0.123.12.23')
Out[1]: <re.Match object; span=(0, 11), match='0.123.12.23'>
In [2]: pattern.fullmatch('192.168.0.1')
Out[2]: <re.Match object; span=(0, 11), match='192.168.0.1'>
In [3]: pattern.fullmatch('255.255.255.255')
Out[3]: <re.Match object; span=(0, 15), match='255.255.255.255'>
# 以上三个ip都属于正常ip，因此能够正确匹配
# -----------------------------------------------
# 以下两个示例不是正确的ip，所以匹配不到，无输出结果
In [4]: pattern.fullmatch('255.255.255.256')
In [5]: pattern.fullmatch('1255.255.255.255')

再使用search、match方法对以上两个错误ip进行匹配测试。

In [11]: pattern.search('255.255.255.256')
Out[11]: <re.Match object; span=(0, 14), match='255.255.255.25'>
# 匹配结果为 255.255.255.25
In [12]: pattern.search('1255.255.255.255')
Out[12]: <re.Match object; span=(1, 15), match='255.255.255.25'>
# 匹配结果为 255.255.255.25
In [13]: pattern.match('255.255.255.256')
Out[13]: <re.Match object; span=(0, 14), match='255.255.255.25'>
# 匹配结果为 255.255.255.25
In [14]: pattern.match('1255.255.255.255')
# 无输出结果
# -----------------------------------
# 请注意观察以下示例的匹配结果
In [15]: pattern.search('257.127.0.0.1')
Out[15]: <re.Match object; span=(1, 11), match='57.127.0.0'>
In [16]: pattern.search('255.255.255.122.256')
Out[16]: <re.Match object; span=(0, 15), match='255.255.255.122'>

为何会出现上述结果？首先对于search、match、fullmatch进行一个对比：

方法	解释
search	只匹配一次，查找整个字符串
match	只匹配一次，从开头开始匹配
fullmatch	对字符串进行完整匹配

由于search匹配时，会查找整个字符串，然后返回满足表达式的结果。

所以使用search方法进行匹配时，对于ip的第一个字段和最后一个字段出错的情况下，会自动进行ip址的截取，尽量使结果满足表达式的要求，但是这种结果并不是我们想要的。

match是从头开始匹配，当ip地址的前三段都正确，而最后一个字段出错时，也无法得出预期的结果。
fullmatch是完全匹配，因此字符串要完全满足ip地址规则时，才会返回正确结果，ip地址有误时，无输出（输出为None）。

当然，非要使用search和match进行匹配也是可以的,首先了解一下“零宽断言”。

零宽断言

用于查找特定内容之前或之后的内容，但并不包括特定内容本身(零宽)。

类似于^、 $、 \b一样的作用，指定某一位置需要满足某些条件(断言)。

表达式	说明
(?=exp)	匹配exp前面的位置（此位置后面是exp）
(?<=exp)	匹配exp后面的位置（此位置前面是exp）
(?!exp)	此位置后面不能是exp
(?<!exp)	此位置前面不能是exp

匹配ip地址时，不允许对不合法的地址进行截取以得到符合规则的ip地址，即是要求：匹配结果在原字符串中的位置之前和之后不能有被截取的点(.)和数字。

根据以上分析修改原有正则表达式，在原表达式的前面添加(?<![\.\d])，最后面添加(?![\.\d])，即修改之后完整的表达式为：

pattern = re.compile(r'(?<![\.\d])(([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])\.){3}([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])(?![\.\d])')

通过上面这条正则表达式，对之前错误的ip地址重新进行匹配验证，

结果如下：

In [1]: import re
In [2]: pattern = re.compile(r'(?<![\.\d])(([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])\.){3}([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])(?![\.\d])')
# 以下各语句执行后都无输出结果，说明正则匹配不成功，ip地址不合法
In [11]: pattern.search('255.255.255.256')
In [12]: pattern.search('1255.255.255.255')
In [13]: pattern.match('255.255.255.256')
In [14]: pattern.match('1255.255.255.255')
In [15]: pattern.search('257.127.0.0.1')
In [16]: pattern.search('255.255.255.122.256')

总结

以上就是在python中如何利用re模块判断ip地址是否合法的介绍。

仅为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

Numpy中ndim、shape、dtype、astype的用法详解
这篇文章主要介绍了Numpy中ndim、shape、dtype、astype的用法详解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-06-06
python实现计数排序与桶排序实例代码
这篇文章主要介绍了python计数排序与桶排序，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-03-03
使用python xmlrpc连接odoo方式
这篇文章主要介绍了使用python xmlrpc连接odoo方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2024-01-01
浅谈tensorflow1.0 池化层（pooling)和全连接层(dense)
本篇文章主要介绍了浅谈tensorflow1.0 池化层（pooling)和全连接层(dense)，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-04-04
Python实现PDF扫描件生成DOCX或EXCEL功能
这篇文章主要介绍了如何利用Python实现将PDF扫描件转为DOCX或EXCEL文件格式功能，文中的示例代码讲解详细，需要的小伙伴可以参考一下
2022-03-03
pytorch绘制曲线的方法
这篇文章主要为大家详细介绍了pytorch绘制曲线的方法，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2021-03-03
Python新手入门之解释器的安装
相信有很多小伙伴还不会安装Python解释器,今天特地整理了本篇文章,文章有非常详细的图文示例,对不会安装的小伙伴很有帮助,需要的朋友可以参考下
2021-06-06
Python时间处理模块time和datetime详解
本文详细介绍了Python中常用的时间处理模块time和datetime,time模块提供多种时间获取和转换功能,datetime模块则在time的基础上增加了日期和时间的组合处理,如datetime.now()获取当前日期时间,两个模块在日常编程中非常有用,尤其是在需要时间日期计算和转换的场景下
2024-10-10
Python 网络爬虫--关于简单的模拟登录实例讲解
今天小编就为大家分享一篇Python 网络爬虫--关于简单的模拟登录实例讲解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-06-06
Python中打包和解包（*和**）的使用详解
*和**在函数的定义和调用阶段，有着不同的功能，并且，*和**不能离开函数使用，这篇文章主要介绍了Python中打包和解包（*和**）的使用详解,需要的朋友可以参考下
2022-08-08