用正则表达式匹配字符串中汉字及中文标点符号

更新时间：2022年07月26日 16:28:17 作者：我是段段

正则表达式通常用于判断某一个字符串是否符合或满足某一种格式,下面这篇文章主要给大家介绍了关于如何使用正则表达式匹配字符串中汉字及中文标点符号的相关资料,需要的朋友可以参考下

问题：

在写项目时遇到需要匹配字符串中所有的汉字并且包括简单的中文标点符号

比如：

匹配下面这个完成的字符串

let str = '上传文件，你好呀，我很好';

网上能够查到很多匹配汉字的正则

let reg = /[\u4e00-\u9fa5]+/g;

console.log(str.match(reg));
// 结果如下
['上传文件', '你好呀', '我很好']

从结果可以看出上面写的正则没有匹配到标点符号，，所以将完整的字符串（str）分隔开了

又从网上查找匹配中文标点的正则

// 匹配中文标点的正则
\u3002|\uff1f|\uff01|\uff0c|\u3001|\uff1b|\uff1a|\u201c|\u201d|\u2018|\u2019|\uff08|\uff09|\u300a|\u300b|\u3010|\u3011|\u007e

// 可以匹配以下中文标点符号（顺序是一一对应的）
// `。 ？ ！ ， 、 ； ： “ ” ‘ ' （ ） 《 》 【 】 ~`

Ps：

如果上面没有想要的标点符号，可以上网查找将中文符号转换成Unicode编码添加在表达式中即可

将刚才编写的正则表达式进行下简单的修改

let reg = /[(\u4e00-\u9fa5)(\u3002|\uff1f|\uff01|\uff0c|\u3001|\uff1b|\uff1a|\u201c|\u201d|\u2018|\u2019|\uff08|\uff09|\u300a|\u300b|\u3010|\u3011|\u007e)]+/g

console.log(str.match(reg));
// 打印结果
['上传文件，你好呀，我很好']

可以看到这次结果是我们想要的形式，整个字符串都匹配到了~

补充：

Unicode 编码并不只是为某个字符简单定义了一个编码，而且还将其进行了归类。

\pP 其中的小写 p 是 property 的意思，表示 Unicode 属性，用于 Unicode 正表达式的前缀。

大写 P 表示 Unicode 字符集七个字符属性之一：标点字符。

其他六个是

L：字母；
M：标记符号（一般不会单独出现）；
Z：分隔符（比如空格、换行等）；
S：符号（比如数学符号、货币符号等）；
N：数字（比如阿拉伯数字、罗马数字等）；
C：其他字符

总结

到此这篇关于用正则表达式匹配字符串中汉字及中文标点符号的文章就介绍到这了,更多相关正则匹配汉字及中文标点符号内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

最常用的15个前端表单验证JS正则表达式
在表单验证中，使用正则表达式来验证正确与否是一个很频繁的操作，本文收集整理了15个常用的JavaScript正则表达式，非常不错，具有参考借鉴价值，需要的朋友参考下吧
2017-07-07
javascript利用正则快速找出两个字符串的不同字符
2007-12-12
在nest.js中通过正则表达式正确设置验证的方法
这篇文章主要介绍了在nest.js中通过正则表达式正确设置验证的方法,文末给大家补充介绍了js正则表达式验证大全，本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴借鉴价值，需要的朋友可以参考下
2022-03-03
php获取超链接文本内容的正则表达式(五种方法)
正则表达式在php中应用非常广泛，下面是脚本之家小编跟大家分享的php获取超链接文本内容的正则表达式，感兴趣的朋友一起看看吧
2015-10-10
javascript正则表达式和字符串RegExp and String（一）
这篇文章主要介绍了javascript正则表达式和字符串RegExp and String（一）的相关资料,需要的朋友可以参考下
2015-10-10
正则表达式中的反向预搜索(上)
这几天在用正则表达式做一个小程序，需要替换内容中的某些特殊字符串。这些字符串的出现是有规律的，那就是在它左面总会特定的内容出现，右面却没有。于是自然就想到了反向预搜索。
2009-12-12
正则表达式详解(正则基础入门教程)
正则表达式是一组由字母和符号组成的特殊文本,它可以用来从文本中找出满足你想要的格式的句子,通俗的讲就是按照某种规则去匹配符合条件的字符串
2023-12-12
JS正则中的match与exec使用说明
match() 方法将检索目标字符串，以找到一个或多个与正则表达式regexp 匹配的文本。
2011-08-08
php+正则将字符串中的字母数字和中文分割
如果一段字符串中出现字母数字还有中文混排的情况，怎么才能将他们区分开呢，经过一番思索，得到了如下代码，分享给大家
2014-06-06
正则表达式的优化全面详解( 三江小渡)
最近经常接触的数据动不动都是几G的量，所以满脑子都是考虑的优化两个字，不过还好之前是搞算法竞赛的，效率这个问题也一直是做斗争的对象，还算习惯吧，最近写正则也比较多，所以参考参考书、博文、自己的经验写点总结性的优化策略
2012-09-09

用正则表达式匹配字符串中汉字及中文标点符号

目录

问题：

比如：

Ps：

补充：

总结

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具