天天看点

把旧数据“冷冻”起来,Facebook这是在干吗?

当有人提到“可持续发展”这个词语的时候,第一个出现在你脑海里的肯定不会是数据中心。而实际上,这些有着庞大的计算机组、网络架构以及存储设备的大楼却是典型的耗电大户。原因就在于,为了保障这些设备正常运转,必须要有一个巨型的冷却系统来保证其一直在低温状态下运行。它们的配电系统会在这一制冷过程中损失近千瓦的电力。并且,为了保障设备不受突发状况导致的停电所影响,这些大厦往往还需要配备有备用电池和柴油发电机。而很明显,这两者并不是什么清洁能源,会严重影响周围的环境。

把旧数据“冷冻”起来,Facebook这是在干吗?

所有这一切都开始于8年前,当时facebook正在着手设计其位于prineville的第一个数据中心。facebook自那时开始,就已经聘用了专门负责可持续发展的董事bill weihl,他直接对facebook的环保工作负责。在此期间,facebook已经做了很长时间的实验,来研究如何设计建立用可持续能源来供电的绿色数据中心。

如今,facebook的数据库中有数十亿的图片,而你肯定无法想像为了存储这些图片将会消耗掉多少电力。在2013年,facebook的图片存储系统haystack一共产生了1eb的数据流量。(1eb=1024pb;1pb=1024tb;1tb=1024gb)这个数字是非常惊人的。虽然这些图片在大多数情况下在被分享几周之后就很少再会被查看了,但是facebook仍然需要保存他们,而且必须要确保即使是在硬盘出现故障的情况下也要保障图片文件的完整性。

这就意味着facebook需要在数据中心保存大量的数据,为了保证这一点就需要其提供大量的电力。而facebook的工程师则巧妙的利用了“负瓦特”,开发了一个名叫"cold storage"的系统。cold storage能够允许facebook数据中心内超过一半的磁盘在任何时候关机,从而实现大幅降低功耗。现在,facebook的存储团队正在考虑进一步节约能源,比如将老旧的图像拷入蓝光磁盘内。

把旧数据“冷冻”起来,Facebook这是在干吗?

目前facebook已经在prineville及 forest 两个中心建设了两套cold storage系统。cold storage系统的每个服务器机柜可容纳1.92 pb的数据。因此,在完全架设完毕的情况下,每一个数据中心可以存储1eb的数据。而且facebook在设计时还考虑到了未来。很多系统在规模扩大或者利用率上升时往往就会出现性能下降的问题,而facebook的这套系统则从一开始设计时就考虑到了。facebook的做法是每次增加容量时,都将软件对现有数据进行再平衡。也就是说将原有数据分配到新的硬件上,并释放之前用过的空间。这个过程并非实时进行,十分适合用于系统的逐步移植。这样既不影响系统的使用,又能逐步将数据迁移到新硬件上。如果把cold storage看作一块大硬盘的话,这种再平衡的做法就可以视为智能硬盘整理程序。

降低耗电是开发cold storage系统的主要目的之一。据介绍这套系统的耗电极低,仅需消耗传统数据中心 1/6的电量。其主要手段就是以空间换功耗——facebook的数据中心占地面积非常大。但是随着以后单盘容量的提升,其存储规模还可以进一步扩大。同时由于cold storage存放的不是活跃数据,而是历史数据,所以 facebook可以把冗余电力系统(不间断电源、柴油发电机、备用电池等)也抛弃了,从而进一步提升了能效。

把旧数据“冷冻”起来,Facebook这是在干吗?

为了尽可能降低能耗,cold storage 允许服务器不带硬盘一起启动,之后将由软件来控制其闲时时段。不过这样就要求facebook对open vault的存储规范进行修改。facebook最大的改动就是——每次只允许为每个托盘上的一块硬盘供电。为了避免软件bug错将所有硬盘都供电,导致数据中心保险烧坏,facebook甚至还专门修改了每一块硬盘驱动器的固件。此外,由于不需要每次都给所有硬盘供电了,facebook还通过一系列的优化成功使得机架的存储密度大大增加,与传统存储服务器相比,其耗电只有后者的 1/4。

在2012年,纽约时报的一篇报道揭露了it业数据中心效率低下,耗电量惊人的问题。自此之后,降低数据中心能耗效率值(pue)便成了考核数据中心的热门指标之一。(pue指数据中心总耗电量与it设备耗电量的比值,这个值越接近1,数据中心的能耗效率就越高)。

而facebook位于北卡莱罗纳的数据中心仅通过使用自然风制冷,并提高服务器硬件的耐热性能,就打造出了pue能耗效率值仅为1.07的超级绿色数据中心。这个数值也大大超过了google数据中心pue能耗效率值——1.12。据介绍,facebook使用bin maker软件分析天气数据,预测出北卡莱罗纳的温度和湿度,然后通过美国采暖、制冷和空调工程师协会(ashrae)的数据来判断是否需要使用空调。

把旧数据“冷冻”起来,Facebook这是在干吗?

此外,facebook还根据其发布的open compute标准开发出了能耐受更高室内温度和湿度的服务器硬件,并通过改善传统数据中心电力供应链来减少在电力转换过程中的能源损失。对传统服务器来说,如果一个ups坏了或者电源部件坏了,整个数据中心就瘫痪了,而对open compute来说,只是某个部分不能继续使用罢了。另外,在维修传统服务器时,维修人员必须将整个服务器拿出来,用工具拆开后才可以修理;而open compute则采用了通用电源插座,维修时直接通过滑轨拉出来就可以实现在线维修。为了进一步提高能源使用效率,甚至连数据中心楼道里的灯都是只有在人通过的情况下才会亮。facebook在提高数据中心能源使用效率上下的功夫可见一斑。

原文发布时间为:2015-11-12

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“bigdatadigest”微信公众号