Go中的指针有两种,一种是内置类型uintptr,本质是一个整型,另一种是unsafe包提供的Pointer,表示可以指向任意类型的指针。通常uintptr用来进行指针计算,因为它是整型,所以很容易计算出下一个指针所指向的位置,而unsafe.Pointer用来进行桥接,用于不同类型的指针进行互相转换。
Go中也提供了unsafe.Pointer和uintptr使用的一些准则。
有了这些基本概念,我们可以怎么玩呢?
通常我们将byte[]转换成string是这样做的:
b := byte[]("Peppa")
string(b)
这个方式有个问题,就是会分配一份内存并进行拷贝,更高效的方式应该是不分配任何内存,在原有内存上进行类型转换。
slice 本质是一个结构体,里面含有指向底层数组的指针以及Len、Cap成员,通过reflect包可以看到slice是这样表示的:
type SliceHeader struct {
Data uintptr
Len int
Cap int
}
其中Data是指向底层数组第一个元素的指针。byte slice之所以能在原有内存上转换成string是因为string结构和slice比较像,通过reflect包可以看到string是这样表示的:
type StringHeader struct {
Data uintptr
Len int
}
所以我们只要在原始内存上构造出来StringHeader就可以了。
sh := reflect.StringHeader{
uintptr(unsafe.Pointer(&b[0])),
len(b),
}
其中Data指向的是slice的第一个元素,Len是slice的长度。这里使用unsafe.Pointer进行了桥接。
创建好StringHeader对象,下一步就是将其转换成string类型的对象,如何做呢?还是通过unsafe.Pointer进行桥接。
*(*string)(unsafe.Pointer(&sh))
先将StringHeader类型的指针转换到unsafe.Pointer,然后再将unsafe.Pointer转换成string类型的指针,最后通过指针取值获得实际的值。
这种通过unsafe.Pointer进行类型转换的方式在unsafe包中也进行了说明,其中举的例子就是math包中的Float64bits方法:
func Float64bits(f float64) uint64 {
return *(*uint64)(unsafe.Pointer(&f))
}
我们可以验证两种方式是否重新分配了内存。
import (
"github.com/davecgh/go-spew/spew"
"unsafe"
"reflect"
"fmt"
)
func byteToString(b []byte) string {
return string(b)
}
func byteToStringNoAlloc(b []byte) string {
if len(v) == 0 {return ""}
sh := reflect.StringHeader{uintptr(unsafe.Pointer(&b[0])), len(b)}
return *(*string)(unsafe.Pointer(&sh))
}
func main() {
b := []byte("Peppa")
fmt.Println("切片第一个元素: ", spew.Sdump(&b[0]))
str := byteToString(b)
sh := (*reflect.StringHeader)(unsafe.Pointer(&str))
fmt.Println("分配内存的方式: ", spew.Sdump(sh))
strNoAlloc := byteToStringNoAlloc(b)
shNoAlloc := (*reflect.StringHeader)(unsafe.Pointer(&toStr))
fmt.Println("不分配内存的方式: ", spew.Sdump(shNoAlloc))
}
这种方式会带来一个比较严重的问题,Data指向的内存可能随时会被回收,因为uintptr是不安全的,所以当那段内存被回收后,这种在原始内存上进行转换的操作可能会导致panic,所以在使用这种方式时要保持警惕。
unsafe包也提供了安全的stringHeader和sliceHeader,不过它们没有暴露出来,所以暂时还没有办法避免内存不被回收的类型转换。