-细数整机柜服务器这些年走过的路、趟过的坑
北京2017年9月11日电 /美通社/ -- 日前,开放数据中心峰会2017在京召开。浪潮整机柜服务器SR成为此次峰会唯一通过ODCC认证的服务器,并且现场展示全新的基于JDM模式的冷存储节点和Purley平台公板。自2009年,浪潮就开始整机柜服务器的研发,至今已占据国内整机柜市场超过60%的份额,从浪潮SR系列服务器的发展历程就能窥见中国整机柜服务器的标准化之路。
一个新兴事物在产生之初是没有标准的,但是一个事物的成熟则需要标准。比如机架服务器为什么都设计成19英寸?为什么都按照4.445cm/U的高度来设计?因为这涉及到一个庞大的产业链,机架甚至机房的设计都会受此标准的影响。
相比机架式服务器,整机柜服务器可以说还是一个学步的儿童,但是随着越来越大的采购需求,整机柜服务器也已经走上了标准化的必由之路。这段路上有哪些故事?其实从浪潮整机柜服务器SR的变化就能完整看到中国整机柜服务器标准化之路,因为SR的产生早于标准、成长源于标准、成果贡献标准。
没有路?那就用脚踩出来!
2009年,云计算业务的开展让互联网数据中心的体量变得日益庞大。顶级互联网企业的服务器年采购量就达到数万台,但是业务需求的高速发展却暴露了IT基础设施的短板。快,是大多数互联网公司的共同要求,然而传统机架服务器单日300-500台的交付量却怎么也达不到“快”的要求。
按照当时的发展速度,在5年内单一互联网客户的服务器年采购量可能将超10万,按照单日交付300台来计算,需要持续交付300多天!“是不是可以考虑更大颗粒度的交付方案?比如整机柜?”这一念头迅速被肯定,浪潮决定要将这一想法产品化。
但是当时国内没有任何设计参考,国外的零星前沿设计也被严格封锁,没有路怎么办?那就用脚踩出来!
从国外互联网数据中心来看,虽然OCP尚未成立,但是类整机柜的产品形态也已经出现,烟囱式散热设计、高密度高性能服务器的设计等更前沿的设计思路,让浪潮看到IT基础设施结构创新可能给数据中心带来巨大的影响。于是一支由各部门精英抽调组建的研发团队成立,封闭起来专注于SR的开发设计。
2010年6月浪潮做出SR整机柜的第一版样机,并在当年12月圣诞节前完成了现场评测。耗时一年之后,SR整机柜1.0正式面向客户开始测试和推广。但由于没有经过实际业务场景的检验,在第一次客户测试中,浪潮发现SR1.0还存在一些瑕疵,比如数百根网线的理线运维。于是SR2.0在不到1年时间被急速推出,这次终于得到认可,客户认为:“你们的产品已经可以产品化了!”
至此,在国内的天蝎联盟、国际的OCP尚未正式诞生之时,浪潮自己用脚踩出来一个“标准”,而在这个过程中积累下的集中管理、集中供电、集中散热设计也被延续,甚至被后来天蝎标准所吸纳。同时这也成为浪潮整机柜服务器SR通往大道的捷径,那时的浪潮已经有了2年2代产品的技术积累,只差一个东风。
既然在11月,那就叫“天蝎计划”吧
2011年11月1日,百度、阿里巴巴、腾讯发起天蝎项目。据说因为11月是天蝎座,因此这个计划也就被叫做“天蝎计划”。中国整机柜服务器开始了标准化之路,引路者是BAT,而奠基者则是浪潮等IT基础设施供应商。
2012年4月,天蝎1.0标准正式发布。因为SR1.0、2.0时期浪潮采用了竖插节点的形式,然而天蝎标准最终选择了横插节点的方案。这相当于把浪潮整机柜服务器的架构重新颠覆、再做一遍。并且,天蝎标准公布后的首次大批量招标就在3个月之后。时间紧迫程度可想而知,这对浪潮来说几乎成为不可逾越的坑。
但是结果,浪潮却神奇地赶上招标,这样的研发效率让业界都觉得不可思议。也正是这段经历,让浪潮成为天蝎联盟第一批支持者,也为浪潮整机柜服务器SR的成功铺好了路,截止2017年上半年SR已经占据中国整机柜服务器市场超过60%的份额。
好东西,当然要拿出来分享
天蝎标准1.0作为整机柜标准的第一代规范,内容并不是特别详细,一些机柜内部的功能界定和部件形态等都没有完全定义。所以天蝎1.0的整机柜机器形态仍然不那么“标准”。
2014年8月,天蝎联盟正式升级为开放数据中心委员会(ODCC),开始以正式行业组织的形式更细化地规范整机柜形态。当月,天蝎2.0标准也正式对外发布。在这个标准中,大部分的功能模块都进行了详尽的定义。经过2年的使用,天蝎2.0也吸收了厂商的设计精华。
浪潮整机柜服务器SR的众多设计被纳入规范,比如背部无线缆大风扇墙设计(集中散热设计)和RMC集中管理设计。从SR1.0的整面无线缆风扇墙的设计既简洁又能防止运维人员的误操作,因此天蝎2.0规范中明确规定的背后的风扇墙设计正是SR一贯的这种设计。另外,SR的RMC(机柜的统一管理模块)创新的置入在电源里这种设计也被统一到了天蝎2.0里,目前所有的整机柜服务器供应商都采用这样的设计。
闭门造车?不如围炉夜话
整机柜服务器的定制化程度很高,需要最大可能地适配业务应用,不像传统浅度定制化服务器的贴贴标签、改改BIOS设置。这让原有的OEM、ODM的模式都像闭门造车一样变得不可取,而JDM模式的出现则让这种“极致”的设计变得可能。
此次ODCC峰会发布了天蝎冷存储标准,在标准的背后则是大数据带来的数据存储成本压力。目前,数据中心的存储服务器一般仍基于双路CPU,不仅采购成本高,并且在3年多的生命周期中将消耗更多的运营成本。为此浪潮与百度以JDM模式,联合开发基于Xeon-D的SN3116M4s冷存储节点,相比E5双路平台服务器低50w左右,在高负载的情况下甚至可以节省60-70w。以1000节点的存储服务器集群为例,每年节省438000千瓦时的电,节省的的电费就超过21万人民币。这无疑对改善海量数据中心TCO有着长期且巨大的帮助。
面向更前沿的技术领域,浪潮的JDM模式也在不断开花结果。与百度联合研发的SR-AI整机柜服务器创造了国内单物理机群AI计算密度;结合BAT需求的SAS Switch存储资源池化方案成为天蝎3.0资源池化项目的重要参考···
从脑中的想法,到纸上的标准,再到实物的公版;从面向单一业务,到开发更多节点,再到池化技术的运用……中国的整机柜服务器向标准化和场景化快速发展。未来,伴随着浪潮与客户对于业务的更深入研究和联合创新,天蝎整机柜也将更具活力。
消息来源: 浪潮集团
扫描二维码微信