php正则表达式中贪婪与非贪婪介绍

 更新时间:2016年03月11日 00:08:52   投稿:mdxy-dxy  
什么叫贪婪,比如说要从字符串中td面包一td td面包二td吃面包,本来你只可以吃面包一,可是你贪心,于是就把第一个td到最后一个td里面的两个面包取出来了,你想多吃点,非贪婪也就是你不贪吃了,就只吃面包一

一、贪婪与非贪婪

什么叫贪婪,比如说要从字符串中<td>面包一</td><td>面包二</td>吃面包,本来你只可以吃面包一,可是你贪心,于是就把第一个<td>到最后一个</td>里面的两个面包取出来了,你想多吃点,非贪婪也就是你不贪吃了,就只吃面包一。

我们来看看正则里面是怎么贪婪的

<?php
$str = '<td>面包一</td><td>面包二</td>';
preg_match('/<td>(.*)<\/td>/',$str,$res);
print_r($res);

结果:

Array
(
    [0] => <td>面包一</td><td>面包二</td>
    [1] => 面包一</td><td>面包二
)

0记录的是整个字符,1表示的是第一次匹配。

怎么来限制贪婪?

<?php
$str = '<td>面包一</td><td>面包二</td>';
preg_match('/<td>(.*?)<\/td>/',$str,$res);
print_r($res);
Array 
( 
 [0] => <td>面包一</td> 
 [1] => 面包一 
)

在修饰匹配次数的特殊符号后再加上一个 "?" 号,则可以使匹配次数不定的表达式尽可能少的匹配。

在PHP中还可以通过修饰符来实现,

<?php
$str = '<td>面包一</td><td>面包二</td>';
preg_match('/<td>(.*)<\/td>/U',$str,$res);
print_r($res);

结果和上面一样。这就是修饰符U的作用

二、预搜索

预搜索是一个非获取匹配,不进行存储供以后使用。

1、正向预搜索 "(?=xxxxx)","(?!xxxxx)"

"(?=xxxxx)”:所在缝隙的右侧,必须能够匹配上 xxxxx 这部分的表达式,

<?php
$str = 'windows NT windows 2003 windows xp';
preg_match('/windows (?=xp)/',$str,$res);
print_r($res);

结果:

Array
(
    [0] => windows
)

这个是xp前面的windows,不会取NT和2003前面的。

格式:"(?!xxxxx)",所在缝隙的右侧,必须不能匹配 xxxxx 这部分表达式

<?php
$str = 'windows NT windows 2003 windows xp';
preg_match_all('/windows (?!xp)/',$str,$res);
print_r($res);

结果:

Array
(
[0] => Array
(
[0] => windows 这个是nt前面的
[1] => windows 这个是2003前面的
)

)

从这里可以看出,预搜索不进行存储供以后使用。

与会存储的对比下。

<?php
$str = 'windows NT windows 2003 windows xp';
preg_match_all('/windows ([^xp])/',$str,$res);
print_r($res);

结果:

Array
(
[0] => Array 全部模式匹配的数组

(
[0] => windows N
[1] => windows 2
)

[1] => Array 子模式所匹配的字符串组成的数组,通过存储取得。
(
[0] => N
[1] => 2
)

)

2、反向预搜索 "(?<=xxxxx)","(?<!xxxxx)"

"(?<=xxxxx)" :所在缝隙的 "左侧”能够匹配xxxxx部分。

<?php
$str = '1234567890123456';
preg_match('/(?<=\d{4})\d+(?=\d{4})/',$str,$res);
print_r($res);

结果:

Array
(
    [0] => 56789012
)

匹配除了前4个数字和后4个数字之外的中间8个数字
"(?<!xxxxx)":所在缝隙的“左侧”不能匹配xxxx部分。

<?php
$str = '我1234567890123456';
preg_match('/(?<!我)\d+/',$str,$res);
print_r($res);

结果:
Array
(
    [0] => 234567890123456
)

 
三、preg和ereg的区别


PHP同时使用两套正则表达式规则,一套是由电气和电子工程师协会(IEEE)制定的POSIX Extended 1003.2兼容正则(事实上PHP对此标准的支持并不完善),另一套来自PCRE(Perl Compatible Regular Expression)库提供PERL兼容正则。 PHP5.3开始POSIX被删除了。

preg_match 比 ereg效率高。

相关文章

  • JavaScript正则表达式上之基本语法(推荐)

    JavaScript正则表达式上之基本语法(推荐)

    一个正则表达式就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式。这篇文章主要介绍了JavaScript正则表达式上之基本语法(推荐)的相关资料,需要的朋友可以参考下
    2016-05-05
  • 正则表达式直接在EXCEL中使用的详细步骤

    正则表达式直接在EXCEL中使用的详细步骤

    这篇文章主要介绍了正则表达式直接在EXCEL中使用的详细步骤,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-03-03
  • 自己学正则时做的笔记,其实正则也不难哦 php

    自己学正则时做的笔记,其实正则也不难哦 php

    自己学正则时做的笔记,其实正则也不难哦 php...
    2006-12-12
  • 在ASP中用正则表达式对象来校验数据的合法性

    在ASP中用正则表达式对象来校验数据的合法性

    我们在制作网站的时候,需要对用户输入的数据进行验证,前端是辅助用户方便填写,后端才是真正的安全过滤,正则表达式对于一些数据校验都是比较常见的不只asp中需要,php也需要,这里脚本之家小白就为大家简单介绍一下
    2006-06-06
  • 常用的正则表达式大全(数字、字符、固定格式)

    常用的正则表达式大全(数字、字符、固定格式)

    正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。本文给大家分享常用的正则表达式大全(数字、字符、固定格式),感兴趣的小伙伴一起学习吧
    2016-04-04
  • EditPlus中的正则表达式 实战(1)

    EditPlus中的正则表达式 实战(1)

    本文通过实例代码较详细的给大家介绍了EditPlus中的正则表达式,非常不错,具有参考借鉴价值,需要的朋友参考下吧
    2016-12-12
  • 正则表达式Regular Expression (RegExp)详解

    正则表达式Regular Expression (RegExp)详解

    正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE
    2015-11-11
  • 重温JavaScript中的正则表达式 js学习笔记

    重温JavaScript中的正则表达式 js学习笔记

    创建正则表达式和创建字符串类似 , 创建正则表达式提供了两种方法 , 一种是采用 new运算符,另一个是采用字面量方式
    2012-07-07
  • 表单正则验证及文件上传验证功能

    表单正则验证及文件上传验证功能

    表单正则验证主要是用来对表单提交信息的过滤,防止sql注入(比如登录界面),上传的文件也需要进行文件名后缀和大小进行验证,下面是一个简单的表单验证实例代码,需要的的朋友参考下吧
    2017-07-07
  • 正则表达式之 Unicode 匹配特殊字符

    正则表达式之 Unicode 匹配特殊字符

    本篇文章由脚本之家小编给大家分享正则表达式巧用 Unicode关键字 匹配特殊字符,感兴趣的朋友一起学习吧
    2015-09-09

最新评论