浅析Golang中rune类型的使用

 更新时间:2023年05月17日 17:08:10   作者:人艰不拆_zmc  
从golang源码中看出,rune关键字是int32的别名(-231~231-1),对比byte(-128~127),可表示的字符更多,本文就来简单聊聊它的使用方法吧,希望对大家有所帮助

1、概述

经常在开源库中看到rune关键字,从golang源码中看出,它是int32的别名(-231~231-1),对比byte(-128~127),可表示的字符更多。

2、使用

由于rune可表示的范围更大,所以能处理一切字符,当然也包括中文字符。在平时计算中文字符,可用rune。

查询官方的解释如下:

// rune is an alias for int32 and is equivalent to int32 in all ways. It is
// used, by convention, to distinguish character values from integer values.
 
//int32的别名,几乎在所有方面等同于int32
//它用来区分字符值和整数值
 
type rune = int32

这样可能还是对rune的作用与意义比较懵逼,我们通过两个简单的示例来看下rune的作用。

示例一:

package main
 
import "fmt"
 
func main() {
 
    var str = "hello 你好"
    fmt.Println("len(str):", len(str))
 
}

输出:

//输出,注意在golang中一个汉字占3个byte
len(str): 12

golang中string底层是通过byte数组实现的。中文字符在unicode下占2个字节,在utf-8编码下占3个字节,而golang默认编码正好是utf-8。

那么?如果我们预期想得到一个字符串的长度,而不是字符串底层占得字节长度,该怎么办呢???

package main
 
import (
    "fmt"
    "unicode/utf8"
)
 
func main() {
 
    var str = "hello 你好"
 
    //golang中string底层是通过byte数组实现的,直接求len 实际是在按字节长度计算  所以一个汉字占3个字节算了3个长度
    fmt.Println("len(str):", len(str))
     
    //以下两种都可以得到str的字符串长度
     
    //golang中的unicode/utf8包提供了用utf-8获取长度的方法
    fmt.Println("RuneCountInString:", utf8.RuneCountInString(str))
 
    //通过rune类型处理unicode字符
    fmt.Println("rune:", len([]rune(str)))
}

输出:

len(str): 12
RuneCountInString: 8
rune: 8

示例二:

package main
 
import "fmt"
 
func main() {
    s := "abc你好"
    r := "123你好"
    fmt.Println("len(s)=", len([]byte(s)), "len(r)=", len([]rune(r))) //len(s)= 9 len(r)= 5
 
    for k, v := range r {
        fmt.Println("k=", k, "v=", v)
    }
 
    for k, v := range []rune(r) {
        fmt.Println("k2=", k, "v2=", v)
    }
}

用range遍历包含中文的字符串时,会发现第一个for中k的值为0,1,2,3,6;第二个for中k的值为0,1,2,3,4;说明字符串中如果包含中文,range的时候可以识别出来,一个中文占用3个byte,索引就自动加三;而rune索引则只会加一。 

3、总结

golang中string底层是通过byte数组实现的。中文字符在unicode下占2个字节,在utf-8编码下占3个字节,golang默认编码是utf-8。如果想得到字符串真正的长度(一个中文算一位),需要将字符串转换为rune,再求长度。

golang中byte数据类型与rune相似,它们都是用来表示字符类型的变量类型。它们的不同在于:

  • byte 等同于int8,常用来处理ascii字符
  • rune 等同于int32,常用来处理unicode或utf-8字符

到此这篇关于浅析Golang中rune类型的使用的文章就介绍到这了,更多相关Golang rune类型内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Go1.18新特性使用Generics泛型进行流式处理

    Go1.18新特性使用Generics泛型进行流式处理

    这篇文章主要为大家介绍了Go1.18新特性使用Generics泛型进行流式处理详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-06-06
  • Go语言中的格式化占位符的实现示例

    Go语言中的格式化占位符的实现示例

    在Go语言中,fmt包提供了丰富的格式化占位符用于输出不同类型的数据,了解和选择合适的占位符对于确保输出内容的正确性和可读性至关重要,本文就来介绍一下,感兴趣的可以学习
    2024-10-10
  • Go异步任务解决方案之Asynq库详解

    Go异步任务解决方案之Asynq库详解

    需要在Go应用程序中异步处理任务? Asynq,简单高效的任务队列实现,下面这篇文章主要给大家介绍了关于Go异步任务解决方案之Asynq库的相关资料,需要的朋友可以参考下
    2023-02-02
  • Go使用协程批量获取数据加快接口返回速度

    Go使用协程批量获取数据加快接口返回速度

    这篇文章主要介绍了Go使用协程批量获取数据加快接口返回速度,使用Go语言后,可以并发获取,极大提升效率,需要的朋友可以参考下
    2023-02-02
  • go sync Waitgroup数据结构实现基本操作详解

    go sync Waitgroup数据结构实现基本操作详解

    这篇文章主要为大家介绍了go sync Waitgroup数据结构实现基本操作详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-01-01
  • Go语言中for循环的经典案例分析

    Go语言中for循环的经典案例分析

    for循环问题,在面试中经常都会被问到,并且在实际业务项目中也经常用到for循环,要是没用好,一不下心就掉坑。本文为大家挑选了几个经典的案例,一块来探讨下,看看如何避免掉坑,多积累积累采坑经验
    2023-02-02
  • Go中变量命名规则与实例

    Go中变量命名规则与实例

    命名规则涉及变量、常量、全局函数、结构、接口、方法等的命名,下面这篇文章主要给大家介绍了关于Go中变量命名的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-01-01
  • Golang实现smtp邮件发送的示例代码

    Golang实现smtp邮件发送的示例代码

    这篇文章主要为大家详细介绍了Golang实现smtp邮件发送的相关知识,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • golang协程设计及调度原理

    golang协程设计及调度原理

    这篇文章主要介绍了golang协程设计及调度原理,文章围绕主题展开详细的内容介绍,具有一定的参考价值,感兴趣的小伙伴可以参考一下
    2022-06-06
  • 在golang中使用cel的用法详解

    在golang中使用cel的用法详解

    CEL 是一种非图灵完备的表达式语言 ,旨在快速、可移植且执行安全,CEL 可以单独使用,也可以嵌入到其他的产品中,本文将给大家介绍一下golang中如何使用cel,需要的朋友可以参考下
    2023-11-11

最新评论