本文是对最近推出的Go 1.1中性能提升进行探究的一系列文章中的最后一篇, 你也可以读一下第一部分和第二部分,了解有关在amd64和386这两方面的信息。
本文着重介绍arm平台的性能。Go 1.1是个比较重要的版本,因为它将arm提升到了与amd64和386同等重要的文章,并引入了对另外的操作系统的支持。Go 1.1为arm带来的一些亮点包括:
这些改进要是没有Shenghou Ma、Rémy Oudompheng以及Daniel Morsing的努力是不可能实现的,他们三位在Go 1.1的这个开发周期内,为该编译器和运行时环境做出了巨大的贡献。
还有,我不得不重重的感谢一下Anthony Starks,他帮着为这篇文章准备了基准测试数据以及所有的图片。
自Go发布之日起,它就支持了多种arm架构。 这里给出的是来自多个主机的基准测试,能够代表出Go 1.1程序在arm主机上的性能。从左上角到右下角分别是
和以前一些,这里给出的结果也可从autobench库中获得,点击略图可以看到全分辨率的大图。
BinaryTree17上获得的加速而在Fannkuch11上略逊一筹,这是受了堆分配器的性能的影响。堆分配部分地涉及到了对存储为64位的量的统计数据的更新,这部分流向了runtime.MemStats。在1.1的开发周期中对原子符号部分进行了一些快速处理,移除了大部分的这些64位的运算,这从基准测试中运行时间的减少就能看出来。
在所有的样例中,net/http的基准测试同时受益于新的轮询器实现和纯net/http软件包在纯Go语言方面的改进,这两部分的工作是由 Brad Fitzpatrick和Jeff Allen来完成的。
runtime基准测试的结果同amd64和386上的完全一致。总体的趋势都是有所改进,在有些情况下提升巨大,比如在map运算方面提升就不小。
Append部分的基准测试有所提升受益于由Rob Pike提交的一个修改,该修改避免了在向[]byte添加少量数据时对runtime.memmove的调用。
在所有的数据中都可以看出,channel操作方面有所退化。这可能是由于在arm平台上完成原子性操作的代价比较高。目前所有原子性操作都是在runtime中实现的,但以后可能会由编译器来直接处理,这样就能减少这部分开销了。
CompareString的基准测试表明同其它的相比它的提升较小,这是因为CL 8056043还没有完全移植到arm平台中呢。
增加了cgo的支持, net软件包的吞吐量有所提升,代码生成和内存垃圾回收器方面也有改进,Go 1.1代表着在arm平台上编写Go程序的一个重要里程碑。
总结本系列的三篇文章起来讲,非常明显,在Go所支持的三个架构下,Go 1.1总体上提供了原先承诺的30-40%的改进。如果我们考虑上编译器方面相对的改进,尽管6g仍为旗舰编译器,也从最快速的底层硬件中获益颇多,但同去年的1.0相比,8g和5g的改进非常大。
如果你读完了这个系列的文章,并且还想继续跟踪Go 1.2的进展, 我们马上就要新开一个autobench的分支,用来跟踪Go 1.1和tip (1.2)的对比情况。弄好之后我会发布博文和推文。
Go 1.2的更改窗口于5月14号就开始了,分配器和内存垃圾回收器已经接收到了来自Dmitry Vyukov的改进,Atom符号也有针对性的在进一步减少GC的代价,还有Carl Shapiro也已经开始同精确收集在栈里分配的值相关的工作。
针对Go 1.2,还有几个建议,一个是需要一个更好的内存分配器,还有一个是要对调度器进行修改,让它具有能够抢占长时间运行的goroutines的能力,其目标在于减小GC的延迟。
最后要说的是,Go 1.2有一个发布时间表。所以,尽管我们说不准到底会有哪些特性能够或者不能包含进1.2中,但是我们能够说的准的是,1.2应该会在2013年底完成。
本文中的所有译文仅用于学习和交流目的,转载请务必注明文章译者、出处、和本文链接。 2KB翻译工作遵照 CC 协议,如果我们的工作有侵犯到您的权益,请及时联系我们。2KB项目(www.2kb.com,源码交易平台),提供担保交易、源码交易、虚拟商品、在家创业、在线创业、任务交易、网站设计、软件设计、网络兼职、站长交易、域名交易、链接买卖、网站交易、广告买卖、站长培训、建站美工等服务