封装常用正则表达式的用法

 更新时间:2014年03月04日 16:20:08   投稿:zxhpj  
这篇文章主要介绍了使用C++封装常用正则表达式的用法,方便以后直接使用,最后还给出了测试代码,大家可运行测试使用

regexhelper.h

复制代码 代码如下:

#ifndef REGEX_HELPER_H_INCLUDE
#define REGEX_HELPER_H_INCLUDE
#include<string>
#include<vector>
namespace Framework{
class RegexHelper
{
public:
    RegexHelper();
    virtual ~RegexHelper();
    /*
    * 是否包含匹配字符串
    * @param: input 输入字符串
    * @param:pattern 正则表达式
    */
    static bool IsMatch(const char* input,const char* pattern);
    /*
    * 获取首个匹配字符串或其字串
    * @param: input 输入字符串
    * @param:pattern 正则表达式
    * @param:group 子捕获组
    */
    static std::string Match(const char* input,const char* pattern,int group = 0);
    /*
    * 获取首个匹配字符串所有捕获组
    * @param: input 输入字符串
    * @param:pattern 正则表达式
    * @param: results 输出的字符串数组
    */
    static int Match(const char* input,const char* pattern,std::vector<std::string>& results);
    /*
    * 匹配字符串数目
    * @param: input 输入字符串
    * @param:pattern 正则表达式
    */
    static int Matches(const char* input,const char* pattern);
    /*
    * 输出所有匹配字符串或其捕获组
    * @param: input 输入字符串
    * @param:pattern 正则表达式
    * @param: results 输出的字符串数组
    * @param:group 捕获组
    */
    static int Matches(const char* input,const char* pattern,std::vector<std::string>& results,int group = 0);
    /*
    * 替换首个匹配字符串
    * @param: input 输入字符串
    * @param:pattern 正则表达式
    * @param:repValue 被替换值,可以是捕获组的组合
    */
    static std::string ReplaceFirst(const char* input,const char* pattern,const char* repValue);
    /*
    * 替换所有匹配字符串
    * @param: input 输入字符串
    * @param:pattern 正则表达式
    * @param:repValue 被替换值,可以是捕获组的组合
    */
    static std::string ReplaceAll(const char* input,const char* pattern,const char* repValue);
    /*
    * 分割字符串并输出结果
    * @param: input 输入字符串
    * @param:pattern 正则表达式
    * @param: results 输出的字符串数组
    */
    static int Split(const char* input,const char* pattern,std::vector<std::string>& results);
    /*
    * 分割字符串并根据捕获组输出
    * @param: input 输入字符串
    * @param:pattern 正则表达式
    * @param:subs 捕获组
    * @param: results 输出的字符串数组
    */
    static int Split(const char* input,const char* pattern,std::vector<int>& subs,std::vector<std::string>& results);

protected:
private:
};
}
#endif // REGEX_HELPER_H_INCLUDE

regexhelper.cpp

复制代码 代码如下:

#include "regexhelper.h"
#include<boost/regex.hpp>

namespace Framework{

RegexHelper::RegexHelper()
{
    //ctor
}

RegexHelper::~RegexHelper()
{
    //dtor
}
bool RegexHelper::IsMatch(const char* input,const char* pattern)
{
    boost::regex reg( pattern , boost::regex::perl|boost::regex::icase);
    bool ret = boost::regex_search( input , reg);
    return ret;
}
std::string RegexHelper::Match(const char* input,const char* pattern,int group)
{
    if(group < 0)group = 0;
    boost::cmatch mat;
    boost::regex reg( pattern , boost::regex::perl|boost::regex::icase);
    bool success = boost::regex_search( input, mat, reg);
    if(success){
        if(mat[group].matched){
            return std::string(mat[group]);
        }
    }
    return std::string("");
}
int RegexHelper::Match(const char* input,const char* pattern,std::vector<std::string>& results)
{
    boost::cmatch mat;
    boost::regex reg( pattern , boost::regex::perl|boost::regex::icase );
    bool success =boost::regex_search( input, mat, reg);
    int total = 0;
    if(success){ //如果匹配成功
        //cout << "match success" << endl;
        //显示所有子串
        for(boost::cmatch::iterator itr=mat.begin(); itr!=mat.end(); ++itr){
            //       指向子串对应首位置        指向子串对应尾位置          子串内容
            //cout << itr->first-szStr << ' ' << itr->second-szStr << ' ' << *itr << endl;
            results.push_back(std::string(*itr));
            total++ ;
        }
    }
    return total;
}
int RegexHelper::Matches(const char* input,const char* pattern)
{
    boost::regex reg( pattern, boost::regex::perl|boost::regex::icase);    //查找字符串里的数字
    boost::cregex_iterator itrBegin = make_regex_iterator(input,reg); //(szStr, szStr+strlen(szStr), reg);
    boost::cregex_iterator itrEnd;
    int total = 0;
    for(boost::cregex_iterator itr=itrBegin; itr!=itrEnd; ++itr){
        //cout << (*itr)[0].first-szStr << ' ' << (*itr)[0].second-szStr << ' ' << *itr << endl;
        total++;
    }
    return total;

}
int RegexHelper::Matches(const char* input,const char* pattern,std::vector<std::string>& results,int group)
{
    if(group < 0)group = 0;
    boost::regex reg( pattern, boost::regex::perl|boost::regex::icase);    //查找字符串里的数字
    boost::cregex_iterator itrBegin = make_regex_iterator(input,reg); //(szStr, szStr+strlen(szStr), reg);
    boost::cregex_iterator itrEnd;
    int total = 0;
    for(boost::cregex_iterator itr=itrBegin; itr!=itrEnd; ++itr){
        //cout << (*itr)[0].first-szStr << ' ' << (*itr)[0].second-szStr << ' ' << *itr << endl;
        results.push_back(std::string((*itr)[group]));
        total++;
    }
    return total;
}
std::string RegexHelper::ReplaceFirst(const char* input,const char* pattern,const char* repValue)
{
    //( 1 )   ((  3  )  2 )((  5 )4)(    6    )
    //(/w+)://((/w+/.)*/w+)((//w*)*)(//w+/./w+)?
    //^协议://网址(x.x...x)/路径(n个/字串)/网页文件(xxx.xxx)
    //const char *szReg = "(\\w+)://((\\w+\\.)*\\w+)((/\\w*)*)(/\\w+\\.\\w+)?";
    //const char *szStr = "http://www.cppprog.com/2009/0112/48.html";
    //repValue = ""
    boost::regex reg( pattern , boost::regex::perl|boost::regex::icase);
    std::string sret = boost::regex_replace( std::string(input), reg, std::string(repValue));
    return sret;
}
std::string RegexHelper::ReplaceAll(const char* input,const char* pattern,const char* repValue)
{
    //string s1 = "(<)|(>)|(&)";
    //string s2 = "(?1&lt;)(?2&gt;)(?3&amp;)";
    boost::regex reg( pattern , boost::regex::perl|boost::regex::icase);
    std::string sret = boost::regex_replace( std::string(input), reg, std::string(repValue), boost::match_default | boost::format_all);
    return sret;
}
int RegexHelper::Split(const char* input,const char* pattern,std::vector<std::string>& results)
{
    boost::regex reg(pattern, boost::regex::perl|boost::regex::icase);  //按/符拆分字符串
    boost::cregex_token_iterator itrBegin = make_regex_token_iterator(input,reg,-1); //使用-1参数时拆分,使用其它数字时表示取第几个子串,可使用数组取多个串
    boost::cregex_token_iterator itrEnd;
    int total = 0;
    for(boost::cregex_token_iterator itr=itrBegin; itr!=itrEnd; ++itr){
        //cout << *itr << endl;
        results.push_back(std::string(*itr));
        total++;
    }
    return total;
}
int RegexHelper::Split(const char* input,const char* pattern,std::vector<int>& subs,std::vector<std::string>& results)
{
    boost::regex reg(pattern, boost::regex::perl|boost::regex::icase);  //取/的前一字符和后一字符
    boost::cregex_token_iterator itrBegin = make_regex_token_iterator(input,reg,subs); //使用-1参数时拆分,使用其它数字时表示取第几个子串,可使用数组取多个串
    boost::cregex_token_iterator itrEnd;
    int total = 0;
    for(boost::cregex_token_iterator itr=itrBegin; itr!=itrEnd; ++itr){
        //cout << *itr << endl;
        results.push_back(std::string(*itr));
        total++;
    }
    return total;
}
}

测试代码

复制代码 代码如下:

void testregex()
{
     //( 1 )   ((  3  )  2 )((  5 )4)(    6    )
        //(/w+)://((/w+/.)*/w+)((//w*)*)(//w+/./w+)?
        //^协议://网址(x.x...x)/路径(n个/字串)/网页文件(xxx.xxx)
        const char *szReg = "(\\w+)://((\\w+\\.)*\\w+)((/\\w*)*)(/\\w+\\.\\w+)?";
        const char *szStr = "sss http://www.cppprog.com/2009/0112/48.html";

        {    //字符串匹配
            cout <<"match:"<< Framework::RegexHelper::IsMatch(szStr,szReg)<<endl;
            //assert(r);
        }

        {    //提取子串
            vector<string> results;
            int total = Framework::RegexHelper::Match(szStr,szReg,results);
            cout << "total="<<total<<endl;
            if(total > 0){
                for(vector<string>::const_iterator it = results.begin(); it != results.end(); ++it){
                    cout<< *it <<endl;
                }
            }

        }

        { //查找
            cout<<Framework::RegexHelper::Match(szStr,"\\d+")<<endl;

        }

        { //替换
            cout<<Framework::RegexHelper::ReplaceFirst(szStr,szReg,"ftp://$2$5")<<endl;
        }
        { //替换2,把<>&转换成网页字符
            string s1 = "(<)|(>)|(&)";
            string s2 = "(?1&lt;)(?2&gt;)(?3&amp;)";
            cout<<Framework::RegexHelper::ReplaceFirst("cout << a&b << endl;",s1.c_str(),s2.c_str())<<endl;
            cout<<Framework::RegexHelper::ReplaceAll("cout << a&b << endl;",s1.c_str(),s2.c_str())<<endl;

        }

        { //使用迭代器找出所有数字
            vector<string> results;
            int total = Framework::RegexHelper::Matches(szStr,"\\d+",results);
            cout << "total="<<total<<endl;
            if(total > 0){
                for(vector<string>::const_iterator it = results.begin(); it != results.end(); ++it){
                    cout<< *it <<endl;
                }
            }
        }

        { //使用迭代器拆分字符串
            vector<string> results;
            int total = Framework::RegexHelper::Split(szStr,"/",results);
            cout << "total="<<total<<endl;
            if(total > 0){
                for(vector<string>::const_iterator it = results.begin(); it != results.end(); ++it){
                    cout<< *it <<endl;
                }
            }

        }

        { //使用迭代器拆分字符串2
            vector<string> results;
            // 第一子串和第二子串
            vector<int> subv;subv.push_back(1),subv.push_back(2);
            //取/的前一字符和后一字符
            int total = Framework::RegexHelper::Split(szStr,"(.)/(.)",subv,results);
            cout << "total="<<total<<endl;
            if(total > 0){
                for(vector<string>::const_iterator it = results.begin(); it != results.end(); ++it){
                    cout<< *it <<endl;
                }
            }
        }
}

相关文章

  • C++设计模式之单例模式

    C++设计模式之单例模式

    这篇文章主要介绍了C++设计模式之单例模式,本文同时给出了4种单例模式的实现代码,需要的朋友可以参考下
    2014-09-09
  • C语言基础函数用法示例详细解析

    C语言基础函数用法示例详细解析

    最接地气的C函数基础介绍,此处对于函数的相关知识点做一些简要的介绍,作者实属初学,写博客也是作者学习的一个过程,难免文章中有内容理解不到位或者有不当之处,还请朋友们不吝指正
    2021-11-11
  • 如何通过C++求出链表中环的入口结点

    如何通过C++求出链表中环的入口结点

    本文主要介绍了通过C++求解链表中环的入口结点,即给一个长度为n链表,若其中包含环,请找出该链表的环的入口结点,否则,返回null。需要的朋友可以参考一下
    2021-12-12
  • opencv实现棋盘格检测

    opencv实现棋盘格检测

    这篇文章主要为大家详细介绍了opencv实现棋盘格检测,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-08-08
  • C++可以函数重载而C不可以的原因分析

    C++可以函数重载而C不可以的原因分析

    函数重载是指在同一个作用域内,可以定义多个函数,它们具有相同的名称但是参数列表不同,为什么C++可以函数重载而C不可以,接下来就有小编来给大家介绍一下C++可以函数重载而C不可以的原因,需要的朋友可以参考下
    2023-12-12
  • 深入探索C++中stack和queue的底层实现

    深入探索C++中stack和queue的底层实现

    这篇文章主要介绍了C++中的stack和dequeue的底层实现,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-09-09
  • C++动态调用动态链接库(DLL或SO)的方法实现

    C++动态调用动态链接库(DLL或SO)的方法实现

    动态链接库是一种Windows操作系统下常见的可执行文件格式,它包含了一些可被其他应用程序调用的函数和数据,本文主要介绍了C++动态调用动态链接库(DLL或SO),感兴趣的可以了解一下
    2024-01-01
  • VC++编程获取窗口句柄的方法小结

    VC++编程获取窗口句柄的方法小结

    这篇文章主要介绍了VC++编程获取窗口句柄的方法,简单总结分析了VC++获取窗口句柄的常见函数与使用技巧,需要的朋友可以参考下
    2017-07-07
  • 详解C 语言项目中.h文件和.c文件的关系

    详解C 语言项目中.h文件和.c文件的关系

    这篇文章主要介绍了详解C 语言项目中.h文件和.c文件的关系的相关资料,需要的朋友可以参考下
    2017-05-05
  • C语言函数调用基础应用详解

    C语言函数调用基础应用详解

    函数就是一段封装好的,可以重复使用的代码,它使得我们的程序更加模块化,不需要编写大量重复的代码。这篇文章主要介绍了c语言是如何处理函数调用的?需要的朋友可以参考下
    2023-02-02

最新评论