php小经验:解析preg_match与preg_match_all 函数

 更新时间:2013年06月29日 10:28:23   作者:  
本篇文章是对php中的preg_match函数与preg_match_all函数进行了详细的分析介绍,需要的朋友参考下
正则表达式在 PHP 中的应用
在 PHP 应用中,正则表达式主要用于:
•正则匹配:根据正则表达式匹配相应的内容
•正则替换:根据正则表达式匹配内容并替换
•正则分割:根据正则表达式分割字符串
在 PHP 中有两类正则表达式函数,一类是 Perl 兼容正则表达式函数,一类是 POSIX 扩展正则表达式函数。二者差别不大,而且推荐使用Perl 兼容正则表达式函数,因此下文都是以 Perl 兼容正则表达式函数为例子说明。
定界符
Perl 兼容模式的正则表达式函数,其正则表达式需要写在定界符中。任何不是字母、数字或反斜线()的字符都可以作为定界符,通常我们使用 / 作为定界符。具体使用见下面的例子。
提示
尽管正则表达式功能非常强大,但如果用普通字符串处理函数能完成的,就尽量不要用正则表达式函数,因为正则表达式效率会低得多。关于普通字符串处理函数。
preg_match()
preg_match() 函数用于进行正则表达式匹配,成功返回 1 ,否则返回 0 。
语法:
int preg_match( string pattern, string subject [, array matches ] )
参数说明:
参数 说明
pattern 正则表达式
subject 需要匹配检索的对象
matches 可选,存储匹配结果的数组, $matches[0] 将包含与整个模式匹配的文本,$matches[1] 将包含与第一个捕获的括号中的子模式所匹配的文本,以此类推
例子 1 :
复制代码 代码如下:

<?php
if(preg_match("/php/i", "PHP is the web scripting language of choice.", $matches)){
    print "A match was found:". $matches[0];
} else {
    print "A match was not found.";
}
?>

浏览器输出:
复制代码 代码如下:

A match was found: PHP

在该例子中,由于使用了 i 修正符,因此会不区分大小写去文本中匹配 php 。
提示
preg_match() 第一次匹配成功后就会停止匹配,如果要实现全部结果的匹配,即搜索到subject结尾处,则需使用 preg_match_all() 函数。
例子 2 ,从一个 URL 中取得主机域名 :
复制代码 代码如下:

<?php
// 从 URL 中取得主机名
preg_match("/^(http://)?([^/]+)/i","https://www.jb51.net/index.html", $matches);
$host = $matches[2];
// 从主机名中取得后面两段
preg_match("/[^./]+.[^./]+$/", $host, $matches);
echo "域名为:{$matches[0]}";
?>

浏览器输出:
复制代码 代码如下:

域名为:jb51.net

preg_match_all()
preg_match_all() 函数用于进行正则表达式全局匹配,成功返回整个模式匹配的次数(可能为零),如果出错返回 FALSE 。
语法:
int preg_match_all( string pattern, string subject, array matches [, int flags ] )
参数说明:
参数 说明
pattern 正则表达式
subject 需要匹配检索的对象
matches 存储匹配结果的数组
flags

可选,指定匹配结果放入 matches 中的顺序,可供选择的标记有:

  1. PREG_PATTERN_ORDER:默认,对结果排序使 $matches[0] 为全部模式匹配的数组,$matches[1] 为第一个括号中的子模式所匹配的字符串组成的数组,以此类推
  2. PREG_SET_ORDER:对结果排序使 $matches[0] 为第一组匹配项的数组,$matches[1] 为第二组匹配项的数组,以此类推
  3. PREG_OFFSET_CAPTURE:如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量
下面的例子演示了将文本中所有 <pre></pre> 标签内的关键字(php)显示为红色。
复制代码 代码如下:

<?php
$str = "<pre>学习php是一件快乐的事。</pre><pre>所有的phper需要共同努力!</pre>";
$kw = "php";
preg_match_all('/<pre>([sS]*?)</pre>/',$str,$mat);
for($i=0;$i<count($mat[0]);$i++){
    $mat[0][$i] = $mat[1][$i];
    $mat[0][$i] = str_replace($kw, '<span style="color:#ff0000">'.$kw.'</span>', $mat[0][$i]);
    $str = str_replace($mat[1][$i], $mat[0][$i], $str);
}
echo $str;
?>

正则匹配中文汉字
正则匹配中文汉字根据页面编码不同而略有区别:
•GBK/GB2312编码:[x80-xff>]+ 或 [xa1-xff]+
•UTF-8编码:[x{4e00}-x{9fa5}]+/u
例子:
复制代码 代码如下:

<?php
$str = "学习php是一件快乐的事。";
preg_match_all("/[x80-xff]+/", $str, $match);
//UTF-8 使用:
//preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
print_r($match);
?>

输出:
复制代码 代码如下:

Array
(
    [0] => Array
        (
            [0] => 学习
            [1] => 是一件快乐的事。
        )

)

相关文章

  • ubuntu 编译安装php 5.3.3+memcache的方法

    ubuntu 编译安装php 5.3.3+memcache的方法

    ubuntu 编译安装php 5.3.3+memcache的方法,需要的朋友可以参考下。
    2010-08-08
  • php HTML无刷新提交表单

    php HTML无刷新提交表单

    这篇文章主要介绍了php HTML无刷新提交表单,本文介绍了两种无刷新提交表单的方法,感兴趣的小伙伴们可以参考一下
    2016-04-04
  • PHP内核介绍及扩展开发指南—基础知识

    PHP内核介绍及扩展开发指南—基础知识

    本章简要介绍一些Zend引擎的内部机制,这些知识和Extensions密切相关,同时也可以帮助我们写出更加高效的PHP代码。
    2011-09-09
  • 我的php学习笔记(毕业设计)

    我的php学习笔记(毕业设计)

    不单是为了做毕业设计,其实更多的是想学会它,能弄弄网站什么的,只要能做好,我觉得就是可以去学,可以去尝试的
    2012-02-02
  • CodeIgniter图像处理类的深入解析

    CodeIgniter图像处理类的深入解析

    本篇文章是对CodeIgniter的图像处理类进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • php 编写安全的代码时容易犯的错误小结

    php 编写安全的代码时容易犯的错误小结

    PHP是个伟大的web开发语言,灵活的语言,但是看到php程序员周而复始的犯的一些错误。我做了下面这个列表,列出了PHP程序员经常犯的10中错误,大多数和安全相关。看看你犯了几种
    2010-05-05
  • PHP操作XML的教程详解

    PHP操作XML的教程详解

    这篇文章主要为大家详细介绍了PHP操作XML的方法,文中的示例代码讲解详细,对我们学习或工作有一定的参考价值,感兴趣的可以了解一下
    2022-05-05
  • PHP基于数组实现的堆栈和队列功能示例

    PHP基于数组实现的堆栈和队列功能示例

    这篇文章主要介绍了PHP基于数组实现的堆栈和队列功能,结合实例形式分析了php基于数组的array_push()、array_pop()、array_shift()等函数实现堆栈与队列的入栈、出栈以及队列的添加、删除等相关操作技巧,需要的朋友可以参考下
    2018-01-01
  • php打造属于自己的MVC框架

    php打造属于自己的MVC框架

    本篇先介绍一下php的MVC实现原理,我们框架的MVC部分也是基于此原理实现的,但是今天的代码并不是框架内的代码,仅仅为说明原理
    2012-03-03
  • php中的常用魔术方法汇总

    php中的常用魔术方法汇总

    本文针对php中的常用魔术方法进行了详细的总结介绍,需要的朋友可以过来参考下
    2016-02-02

最新评论