Go 的 rune byte 和 string
rune、byte和string都是Go的内置类型
byte- byte是
uint8的别名,在所有方面都等同于uint8 - 按惯例,它用于区分字节值和8位无符号整数值。
- byte是
runerune是int32的别名,在所有方面都等同于int32- 按惯例,它用于区分字符值和整数值。
string- string是所有8位字节字符串的集合,通常但不一定代表UTF-8编码的文本
- 字符串可能为空,但是不能为
nil - 字符串类型的值是不可变的
- 由上面得解释我们大概可以明白
rune可以表示得比byte多string类型的底层是一个byte数组- 以上解释都来此
Go源码注释
- 刚刚上面标注了字节和字符,现在我们来梳理字符和字节的概念
-
存储单位 字节
- 计算机存储信息的最小单位,称之为位
bit,二进制的一个0或1叫一位 - 计算机存储容量基本单位是字节
Byte,8个二进制位组成1个字节
- 计算机存储信息的最小单位,称之为位
-
信息表示单位 字符
- 字符 是一种符号,像 英文
a和中文阿就是不同字符 - 不同的字符在不同的编码格式下,所需要的存储单位不一样
ASCLII编码中一个英文字母一字节,一个汉字两字节UTF-8编码中 一个英文字母一字节,一个常见汉字3字节,不常用的超大字符集汉字4字节
- 字符 是一种符号,像 英文
Go源码文件默认采用Unicode字符集,Unicode码点和内存中字节序列的变换实现使用了UTF-8,这使得Go编程无需考虑编码转换的问题非常方便- 从编码上来分析
byte用来强调一个字节代表的数据(例如字符a就是97),而不是数字;rune用来表示Unicode的码点,即一个字符- 通俗一点
byte只能操作简单的字符,不支持中文操作rune能操作任何字符
- 代码演示
package main
import "fmt"
func main() {
str := "hello 世界!"
fmt.Println(str)
fmt.Println(len(str))
fmt.Println(str[1])
fmt.Println(string(str[1]))
fmt.Println(str[1:])
fmt.Println(str[7:])
}
*************************************
输出
hello 世界!
13
101
e
ello 世界!
��界!
- 会输出
hello 世界!,这证明Go是UTF-8编码的,输出长度为13这说明了一个汉字3字节 - 输出
ello 世界!说明string底层的数据结构是数组 - 输出
��界!说明string底层是一个byte数组,不然不会乱码
package main
import "fmt"
func StrChangeByRune(str *string, i int, ch rune) {
temp := []rune(*str)
temp[i] = ch
*str = string(temp)
}
func StrChangeByByte(str *string, i int, ch byte) {
temp := []byte(*str)
temp[i] = ch
*str = string(temp)
}
func main() {
str := "你好 hello"
str1 := "你好 hello"
StrChangeByRune(&str, 1, 'A')
StrChangeByByte(&str1, 1, 'A')
fmt.Println(str)
fmt.Println(str1)
}
*******************************
输出
你A hello
�A�好 hello
- 由输出
你A hello和�A�好 hello可以看出 byte的操作单位是一个字节,可以理解为一个英文字符rune的操作单位是一个字符,不管这个字符是什么字符
本作品采用《CC 协议》,转载必须注明作者和本文链接
关于 LearnKu
推荐文章: