Java 判断字符串中是否包含中文的实例详解
Java 判断字符串中是否包含中文的实例详解
Java判断一个字符串是否有中文是利用Unicode编码来判断,因为中文的编码区间为:0x4e00--0x9fbb, 不过通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会得到错误的结果。而且利用区间判断中文效率也并不高,例如:str.substring(i, i + 1).matches("[\\一-\\?]+"),就需要遍历整个字符串,如果字符串太长效率非常低,而且判断标点还会错误。这里提高 一个高效准确的判断方法,使用Java中的Character类:
实例代码:
package test; import static java.lang.Character.UnicodeBlock.*; import com.google.common.base.Strings; public class CheckContainChinese { public static void main(String[] args) { String containChinese = "test,我有中文"; String containNoChiese = "test, i don't contain chinese"; System.out.println("containChinese 是否包含中文 :" + checkStringContainChinese(containChinese)); System.out.println("containNoChiese 是否包含中文 :" + checkStringContainChinese(containNoChiese)); } private static boolean checkStringContainChinese(String checkStr){ if(!Strings.isNullOrEmpty(checkStr)){ char[] checkChars = checkStr.toCharArray(); for(int i = 0; i < checkChars.length; i++){ char checkChar = checkChars[i]; if(checkCharContainChinese(checkChar)){ return true; } } } return false; } private static boolean checkCharContainChinese(char checkChar){ Character.UnicodeBlock ub = Character.UnicodeBlock.of(checkChar); if(CJK_UNIFIED_IDEOGRAPHS == ub || CJK_COMPATIBILITY_IDEOGRAPHS == ub || CJK_COMPATIBILITY_FORMS == ub || CJK_RADICALS_SUPPLEMENT == ub || CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A == ub || CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B == ub){ return true; } return false; } }
运行结果:
以上就是java 检查字符串是否含有中文的实例,如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
相关文章
Java使用poi-tl1.9.1生成Word文档的技巧分享
本文将简单介绍poi-tl的相关知识,通过一个实际的案例实践,充分介绍如何利用poi-tl进行目标文档的生成,同时分享几个不同的office版本如何进行图表生成的解决方案,需要的朋友可以参考下2023-09-09java synchronized加载加锁-线程可重入详解及实例代码
这篇文章主要介绍了java synchronized加载加锁-线程可重入详解及实例代码的相关资料,需要的朋友可以参考下2017-02-02RabbitMQ的Direct Exchange模式实现的消息发布案例(示例代码)
本文介绍了RabbitMQ的DirectExchange模式下的消息发布和消费的实现,详细说明了如何在DirectExchange模式中进行消息的发送和接收,以及消息处理的基本方法,感兴趣的朋友跟随小编一起看看吧2024-09-09
最新评论