天天看点

Go GC:在 Go 1.5 解决延迟问题

richard l. hudson (rick) 是内存管理方面的专家,发明了 train, sapphire, 和 mississippi delta 等算法,其中 gc stack maps 算法使静态类型语言(比如:java,c#, go)的垃圾收集成为可能。他发表了很多关于语言运行时内存管理、并发、并行、内存模型、事务内存的文章。rick 是 google go 团队的一员,并负责 go 的 gc 和运行时的问题。

在经济上,有个词叫良性循环 —— 不同的事务之间互相促进。在过去的技术界,软硬件的开发也曾近有类似的良性循环。随着 cpu 硬件的升级,运行更快的软件被开发出来,这又促使 cpu 的速度和计算能力进一步的提升。在 2004 年左右,随着摩尔定理的终止,这个良性循环也结束了。

现在,更多的晶体管不会带来更快的速度。更多的晶体管意味着更多的核,但是软件还不能完全发挥多核的性能。因为今天的软件不能让多核全部跑起来,那些搞硬件的就不会在 cpu 中集成更多的核。循环被破坏了。

go 的一个长期目标就是通过提供更多的并行、并发程序来重启这个循环。短期内,我们要做的是提高 go 的使用率。目前 go 运行时遇到的最大的问题是 gc 暂停时间太长。

当他的团队开始接手这个问题,他像其它工程师一样开玩笑说,他们最开始的反应不是为了解决这个问题,而是这样解决问题:

添加一个监控器,不停的跟踪计算机和 gc

当 gc、网络延时、等怪情况发生时,发出一个网络等待标志

但是 russ cox 否决了这些想法,所以他们决定挽起袖子好好的努力提升 go 的 gc。他们开发的算法会牺牲程序的运行能力来减少 gc 延迟。也就是说为了实现更低的 gc 延迟,go 程序会比以前跑的稍微慢一点。

怎样使延迟具体化?

纳秒: grace hopper 用距离类推时间。 一纳秒等于11.8英寸。

微秒: 光在真空中走1英里所用的时间就是5.4微秒。

毫秒

1:从 ssd 中连续的读取1mb内存

20:从副产品磁盘中读取1mb内存

50:感性的因果关系 (眼睛/光标 响应的临界点).

50+: 各种各样的网络延迟

300: 眨眼

所以我们能够在1毫秒的时间内做多少 gc?

java gc vs. go gc

Go GC:在 Go 1.5 解决延迟问题

go:

成千上万的 goroutines

使用管道进行同步

执行 go 的运行时间,使 go 和用户同步

空间位置的控制 (可以嵌入结构,内部指针 (&foo.field))

java:

数十个java线程

使用对象/锁的同步

由c实现的运行时间

对象连接指针

最大的区别在于空间位置的问题。 在java中, 一切都是指针,然而 go 能够让你在线程中嵌入另一个线程。以下的多层指针严重地导致了垃圾回收器的很多问题。

gc 基本知识

下面是一个关于垃圾回收器的快速入门,它们通常涉及2个阶段。

Go GC:在 Go 1.5 解决延迟问题

扫描阶段:在堆中确定哪些东西是可获得的。 这涉及到堆、缓存器、全局变量的指针的开始,到这些指针进入到栈。

标记阶段:绕指针一圈。在你读取的程序中尽可能标记出对象。从 gc 的角度来说, 当标记的段落并发的时候,指针还没有改变,要终止它是最简单的。gc 真正地并发是非常难的,因为指针是不断改变的。 程序使用被称为执行障碍的一些东西去关联 gc,但是它并不会回收对象。 在实践中, 写屏障会比暂停回收器昂贵。