java转换字符串编码格式的方法

 更新时间:2018年08月16日 10:50:45   作者:du_xian_sheng  
这篇文章主要介绍了java转换字符串编码格式的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧

java转换字符串编码格式 (解码错误,重新解码)

字符集概念:规定了某个文字对应的二进制数字存放方式(编码)和某串二进制数值代表了哪个文字(解码)的转换关系。

我们在计算机屏幕上看到的是实体化的文字,而在计算机存储介质中存放的实际是二进制的比特流。 

乱码场景(纯属瞎掰):

1) 前台输入utf-8编码的一串汉字(string1)。 (页面编码为utf-8, 在内存中会将这串汉字以utf-8编码为对应的二进制流存储)

2) 这串汉字(string1)的二进制流在经过http协议传输到后台时,这段比特流会被以iso-8859-1编码强行解码为字符串(string2)。

(2.1 http默认编码格式为iso-8859-1)

(2.2 这个默认编码在什么时候起作用呢? 应该是在到达tomcat之后, 到达servlet之前, tomcat对request请求强行使用iso-8859-1进行了解码)

(2.3 有什么办法阻止tomcat对request请求强行iso-8859-1解码呢?

apache-tomcat\conf\server.xml中添加URIEncoding="UTF-8"配置即可,还是来个图吧)

 

3) 在后台(servlet)接收字符串(string2)时毫无疑问的乱码了。

) 这时需要将接收到的字符串(string2)根据iso-8859-1编码重新转换为byte流。再将byte流根据utf-8编码重新解码为字符串(sting3)。

5) 这时的字符串(string3)和前台的字符串(string1)是对应同一个二进制流,并且使用的是同一种编码。也就不会乱码了。

乱码的另一种解决办法:

request.setCharacterEncoding("UTF-8"),这句话熟悉么,这句话的意思是:用"utf-8"编码对客户端的请求进行重新解码。

在步骤2之后(或步骤3中)执行,那么接收到的参数也不会乱码啦。 

一个小例子:

import java.io.UnsupportedEncodingException;

public class ConvertEncodingFormat {

  /**
   * 将一段错误解码的字符串重新解码
   */
  public static String convertEncodingFormat(String str, String formatFrom, String FormatTo) {
    String result = null;
    if (!(str == null || str.length() == 0)) {
      try {
        result = new String(str.getBytes(formatFrom), FormatTo);
      } catch (UnsupportedEncodingException e) {
        e.printStackTrace();
      }
    }
    return result;
  }

  /**
   * test
   */
  public static void main(String[] args) {
     // utf-8编码
    String str = "你好,少年!";

    // UTF-8编码的byte流强行用iso-8859-1解码,毫无疑问的乱码了
    String str1 = convertEncodingFormat(str, "UTF-8", "iso-8859-1");
    System.out.println(str1);

    // 将str1再转化为byte流,重新用UTF-8解码,乱码问题解决
    String str2 = convertEncodingFormat(str1, "iso-8859-1", "UTF-8");
    System.out.println(str2);
  }

}

java字符串的各种编码转换

import java.io.UnsupportedEncodingException; 
 
/** 
 * 转换字符串的编码 
 */ 
public class ChangeCharset { 
 /** 7位ASCII字符,也叫作ISO646-US、Unicode字符集的基本拉丁块 */ 
 public static final String US_ASCII = "US-ASCII"; 
 
 /** ISO 拉丁字母表 No.1,也叫作 ISO-LATIN-1 */ 
 public static final String ISO_8859_1 = "ISO-8859-1"; 
 
 /** 8 位 UCS 转换格式 */ 
 public static final String UTF_8 = "UTF-8"; 
 
 /** 16 位 UCS 转换格式,Big Endian(最低地址存放高位字节)字节顺序 */ 
 public static final String UTF_16BE = "UTF-16BE"; 
 
 /** 16 位 UCS 转换格式,Little-endian(最高地址存放低位字节)字节顺序 */ 
 public static final String UTF_16LE = "UTF-16LE"; 
 
 /** 16 位 UCS 转换格式,字节顺序由可选的字节顺序标记来标识 */ 
 public static final String UTF_16 = "UTF-16"; 
 
 /** 中文超大字符集 */ 
 public static final String GBK = "GBK"; 
 
 /** 
 * 将字符编码转换成US-ASCII码 
 */ 
 public String toASCII(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, US_ASCII); 
 } 
 /** 
 * 将字符编码转换成ISO-8859-1码 
 */ 
 public String toISO_8859_1(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, ISO_8859_1); 
 } 
 /** 
 * 将字符编码转换成UTF-8码 
 */ 
 public String toUTF_8(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, UTF_8); 
 } 
 /** 
 * 将字符编码转换成UTF-16BE码 
 */ 
 public String toUTF_16BE(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, UTF_16BE); 
 } 
 /** 
 * 将字符编码转换成UTF-16LE码 
 */ 
 public String toUTF_16LE(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, UTF_16LE); 
 } 
 /** 
 * 将字符编码转换成UTF-16码 
 */ 
 public String toUTF_16(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, UTF_16); 
 } 
 /** 
 * 将字符编码转换成GBK码 
 */ 
 public String toGBK(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, GBK); 
 } 
  
 /** 
 * 字符串编码转换的实现方法 
 * @param str 待转换编码的字符串 
 * @param newCharset 目标编码 
 * @return 
 * @throws UnsupportedEncodingException 
 */ 
 public String changeCharset(String str, String newCharset) 
  throws UnsupportedEncodingException { 
 if (str != null) { 
  //用默认字符编码解码字符串。 
  byte[] bs = str.getBytes(); 
  //用新的字符编码生成字符串 
  return new String(bs, newCharset); 
 } 
 return null; 
 } 
 /** 
 * 字符串编码转换的实现方法 
 * @param str 待转换编码的字符串 
 * @param oldCharset 原编码 
 * @param newCharset 目标编码 
 * @return 
 * @throws UnsupportedEncodingException 
 */ 
 public String changeCharset(String str, String oldCharset, String newCharset) 
  throws UnsupportedEncodingException { 
 if (str != null) { 
  //用旧的字符编码解码字符串。解码可能会出现异常。 
  byte[] bs = str.getBytes(oldCharset); 
  //用新的字符编码生成字符串 
  return new String(bs, newCharset); 
 } 
 return null; 
 } 
 
 public static void main(String[] args) throws UnsupportedEncodingException { 
 ChangeCharset test = new ChangeCharset(); 
 String str = "This is a 中文的 String!"; 
 System.out.println("str: " + str); 
 String gbk = test.toGBK(str); 
 System.out.println("转换成GBK码: " + gbk); 
 System.out.println(); 
 String ascii = test.toASCII(str); 
 System.out.println("转换成US-ASCII码: " + ascii); 
 gbk = test.changeCharset(ascii,ChangeCharset.US_ASCII, ChangeCharset.GBK); 
 System.out.println("再把ASCII码的字符串转换成GBK码: " + gbk); 
 System.out.println(); 
 String iso88591 = test.toISO_8859_1(str); 
 System.out.println("转换成ISO-8859-1码: " + iso88591); 
 gbk = test.changeCharset(iso88591,ChangeCharset.ISO_8859_1, ChangeCharset.GBK); 
 System.out.println("再把ISO-8859-1码的字符串转换成GBK码: " + gbk); 
 System.out.println(); 
 String utf8 = test.toUTF_8(str); 
 System.out.println("转换成UTF-8码: " + utf8); 
 gbk = test.changeCharset(utf8,ChangeCharset.UTF_8, ChangeCharset.GBK); 
 System.out.println("再把UTF-8码的字符串转换成GBK码: " + gbk); 
 System.out.println(); 
 String utf16be = test.toUTF_16BE(str); 
 System.out.println("转换成UTF-16BE码:" + utf16be); 
 gbk = test.changeCharset(utf16be,ChangeCharset.UTF_16BE, ChangeCharset.GBK); 
 System.out.println("再把UTF-16BE码的字符串转换成GBK码: " + gbk); 
 System.out.println(); 
 String utf16le = test.toUTF_16LE(str); 
 System.out.println("转换成UTF-16LE码:" + utf16le); 
 gbk = test.changeCharset(utf16le,ChangeCharset.UTF_16LE, ChangeCharset.GBK); 
 System.out.println("再把UTF-16LE码的字符串转换成GBK码: " + gbk); 
 System.out.println(); 
 String utf16 = test.toUTF_16(str); 
 System.out.println("转换成UTF-16码:" + utf16); 
 gbk = test.changeCharset(utf16,ChangeCharset.UTF_16LE, ChangeCharset.GBK); 
 System.out.println("再把UTF-16码的字符串转换成GBK码: " + gbk); 
 String s = new String("中文".getBytes("UTF-8"),"UTF-8"); 
 System.out.println(s); 
 } 
} 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • JAVA中取整数的4种方法总结

    JAVA中取整数的4种方法总结

    这篇文章主要给大家介绍了关于JAVA中取整数的4种方法,在java的Math类中,提供了许许多多的和数学计算有关的方法,其中也包括取整的,需要的朋友可以参考下
    2023-07-07
  • JAVA提高第七篇 类加载器解析

    JAVA提高第七篇 类加载器解析

    这篇文章主要为大家详细介绍了JAVA提高第七篇类加载器的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-10-10
  • 解决SpringBoot返回结果如果为null或空值不显示处理问题

    解决SpringBoot返回结果如果为null或空值不显示处理问题

    这篇文章主要介绍了解决SpringBoot返回结果如果为null或空值不显示处理问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-07-07
  • 关于springboot2.4跨域配置问题

    关于springboot2.4跨域配置问题

    这篇文章主要介绍了springboot2.4跨域配置的方法,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-07-07
  • Java基础之JDK1.8新特性lambda表达式详解

    Java基础之JDK1.8新特性lambda表达式详解

    函数式接口有且仅有一个抽象方法,但是可以有多个非抽象方法的接口,函数式接口可以被隐式转换为lambda表达式,这篇文章主要介绍了Java基础之lambda表达式(JDK1.8新特性),需要的朋友可以参考下
    2023-08-08
  • Java实现简单的飞机大战游戏(敌机下落篇)

    Java实现简单的飞机大战游戏(敌机下落篇)

    这篇文章主要为大家详细介绍了Java实现简单的飞机大战游戏,敌机下落篇,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-05-05
  • java 使用JDBC构建简单的数据访问层实例详解

    java 使用JDBC构建简单的数据访问层实例详解

    以下是如何使用JDBC构建一个数据访问层,包括数据转换(将从数据库中查询的数据封装到对应的对象中……),数据库的建立,以及如何连接到数据库,需要的朋友可以参考下
    2016-11-11
  • Java中的Map集合根据key值排序的实现

    Java中的Map集合根据key值排序的实现

    本文主要介绍了Java中的Map集合如何根据key值排序,包含使用TreeMap和使用lambda表达式和Stream流两种方法,具有一定的参考价值,感兴趣的可以了解一下
    2024-03-03
  • MyBatis XPathParser解析器使用范例详解

    MyBatis XPathParser解析器使用范例详解

    这篇文章主要介绍了关于MyBatis中解析器XPathParser的实际使用实践,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2022-07-07
  • java 地心坐标系(ECEF)和WGS-84坐标系(WGS84)互转的实现

    java 地心坐标系(ECEF)和WGS-84坐标系(WGS84)互转的实现

    这篇文章主要介绍了java 地心坐标系(ECEF)和WGS-84坐标系(WGS84)互转的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-09-09

最新评论