英特尔与百度如何落地碳中和 | 碳中和系列03
2021-12-08 11:24 碳中和 百度 英特尔

文丨夏小舒

系列导语:2019年11月底,澳大利亚著名气候学家威尔·斯特芬在《自然》杂志发表的一篇研究指出,现在15个已知的全球气候临界点,已经激活了9个。目前情况正在进一步恶化。欧盟和美国表示在 2050年实现碳中和。中国也提出2030年碳达峰、2060年碳中和。3060的刚性承诺,让碳中和趋势变为必然,且有明确的时间表。

投资人士指出,“双碳”战略是未来全球经济运行和资本市场不确定性中最大的确定性,蕴含巨量投资机会,绿色投资将是今后几十年最大的投资主题和赛道。趋势之下,我们看到从跨国巨头到创业公司均发布了它们的碳中和计划或者案例。为3060以及全球气候变化贡献来自创业者的力量,创业黑马推出的碳中和系列旨在发掘优秀的项目,并将其推而广之。

11月22日,英特尔&百度举办了节能减排案例分享会。

会上,英特尔和百度公布了它们在定制化CPU、数据存储、异构计算平台、整机柜的设计和供电、散热设计等多个方面进行合作,以期达到降本增效、节能减排的目标。

而更早之前,英特尔5月发布了《2020-2021英特尔企业社会责任报告》,英特尔已经持续深耕可持续发展领域多年,不仅通过自身的运营减少碳排放,也同时扩大自己的技术“手印”,和合作伙伴一起推进“碳中和”的目标。

今年6月,百度正式公布了在2030年要实现百度集团运营层面的“碳中和”目标。在这个过程中百度以2020年为基准年,计划在已有绿色实践基础之上,参照《温室气体核算体系》范围一、二类型,在数据中心、办公楼宇、碳抵消、智能交通、智能云、供应链六个方面,全面构建2030年碳中和目标的科学实现路径。

在2030年以后,百度希望同生态伙伴一道,进一步努力实现“负碳排放”,助力中国“2060年碳中和”目标的达成,助力实现全球温升不超过1.5摄氏度的气候目标。

定制化CPU

近年来,随着公有云快速发展,数据中心CPU呈现多核、高算力、高总线带宽、高功耗的趋势,如何既能满足算力增长又能保持较低的功耗,也就是更高的能耗比呢?CPU定制是一个解决方案,百度是最早与英特尔开展CPU定制的互联网厂商之一,并且经过三代英特尔至强可扩展处理器的定制实践和积累,CPU定制技术已经非常成熟,也取得了不错的成果。

CPU是通用处理器,在生产和制造过程中,为了满足通用性,会考虑各种计算场景下的需求,因此除了CPU计算核心,还会有很多加速单元或互联IO等部件,这些都会有功耗成本。为满足百度业务场景,通过CPU定制实现CPU核心和这些部件之间的配置优化,从而实现能耗比的优化。这其中有三个逻辑:一方面,通过裁剪不必要的CPU功能部件或者降低CPU个别feature的规格来提升性能;另一方面,通过增强CPU相关的参数,比如频率等,进一步提高性能;第三,与系统设计紧耦合,采用更优化的系统散热设计,比如液冷,降低CPU的Tcase温度,来获取主频的提升。通过这样一系列的优化组合,最终实现提高能耗比,达到节能、增效的目的。

通过与英特尔进行CPU深度定制,百度每一代CPU性能对比上一代都会有1.5倍以上的提升,并且在满足业务需求的情况下,实现了高算力、低能耗,提高了能耗比,最终实现降本增效。

数据分层存储

所谓的分层存储,简单来说,指的是根据数据的冷热程度,采用不同的存储介质和对应的基础架构软件存储解决方案,保障存储性能的同时实现物理成本和功耗的降低,这是目前业界非常流行的做法。

根据业务实时访问的不同性能要求和带宽需求,百度把数据分成“热、温、冷、冰”四级存储。在不同的分层存储上,百度与英特尔有着密切的合作。在热存储层,百度使用了英特尔的1T、4T、8T NVMe高性能盘;在温/冷存储层,百度使用了英特尔的低核数、低算力、低成本的处理器;而冰存储是磁带级的解决方案,在计算机头的存储方案上,综合考虑性能和寿命需求,要选一个合适的写cache,这个写cache需要支持并发混合读写且擦写寿命长,英特尔的傲腾™盘得到了很好的应用。

另外,英特尔提供的傲腾™持久内存,是在DDR和SSD之间插入了一层基于3D XPoint介质的内存产品,可以提供接近DDR内存的性能,但是拥有容量更大、成本更低的优势。英特尔不仅仅提供硬件本身,还结合硬件提供了软件的开发套件PMDK。

百度和英特尔合作开发了用户态单机存储引擎,利用PMDK和SPDK软件开发套件结合持久内存,可以从用户态直接访问内存介质,从而绕过了文件系统、系统调用以及驱动等复杂的流程,大幅提高了性能。

异构计算平台

现在整个业界都存在异构AI加速硬件分配率高、使用率低的问题,造成了一定的能耗浪费。在异构层面,目前存量和增量最大的问题,就是如何提升异构加速硬件的利用率。要想提升异构设备的利用率,最重要的就是做好异构设备的虚拟化。

通过虚拟化让单卡的运行能够承接更多的业务模型,提升设备的利用率,让它能承担更多业务,挖掘更多的算力,使更多的轻型负载混布在一张卡上,从而改善集群效能,降低业务的使用成本,达到“绿色、节能”的目的。

在异构计算方面,双方结合了彼此的优势进行合作。英特尔的优势是有CPU、GPU、AI加速卡等各种不同的异构硬件,可以提供全线的产品。百度的优势是拥有大量的应用场景,非常熟悉业务的特征。双方的团队目前围绕百度AI的核心业务,通过提取业务的本身特征,定义不同业务类型的性能基准,再配合使用英特尔提供的异构硬件,从而实现整个AI应用平台在异构算力上结合虚拟化技术达到可量化、可分配的目的。

通过综合利用率的提升带来算力的能耗收益,解决了目前部分异构AI加速硬件高分配率、低使用率的问题,也有助于百度和英特尔达成在AI方面节能减耗的目标。

整机柜的设计和供电

2012年,天蝎1.0破茧而出,概念发布,首次商用。百度在天蝎1.0项目中率先推出并使用整机柜技术,实现集中供电、集中散热和集中管理的池化设计。至今,百度整机柜已经发展到了天蝎4.0,每一次迭代的标准演进和架构优化都体现了对节能减排的思考。英特尔是ODCC的早期成员,也一直在倡导整机柜和集中供电的设计理念,推动集中供电技术的演进和解决方案的落地。

整机柜对于节能减排的设计可以通过六大子系统体现出来:机构、供电、散热、节点、网络、管理。

相比传统的2U服务器,百度天蝎整机柜支持1U高度的服务器节点,早期,节点功耗比较低,天蝎1.0可以做到1U3节点,这样一个机柜能放几十个节点,这样高密度的部署大大降低了机构的成本分摊;供电层面,采用自研定制的集中式供电方案;散热层面,设计了风扇墙,把节点内部的风扇拿出来,选择功耗更低的风扇,提高了散热效率;管理层面,对每个节点进行实时的功耗和温度监控,动态调整风扇转速进行散热,让风扇以最佳的转速运行,实现最优功耗。通过这些综合的策略,形成了标准化的行业规范。整体从TCO维度来讲,TCO收益优化了10%到20%。

近年来CPU和GPU的功耗持续在增加,单节点的功耗也变得越来越高。目前的服务器大部分都采取的是12V的解决方案,同等功率的节点,12V供电相比48V供电,供电电流高出3倍。功耗=I²R,假设铜排电阻不变,12V供电的铜排损耗是48V的16倍,传输线路上如此高的热损耗,不利于节能,也不利于整机设计。电源解决方案从12V到48V,提升了供电效率,减少了电路传输损耗,整机柜供电效率得到提升,实现了节能。

目前在百度的数据中心,48V整机柜集中供电解决方案已经规模化落地,该方案采用了定制的双输入48V钛金电源,总体电源数量至少可以减少37.5%,电源供电效率提升了2%,铜排上的损耗减少了90%,这些数据为节能起到了非常好的示范作用。

随着CPU和GPU功耗继续不断的攀升,除了提升整机供电转换效率,未来节点的设计和技术还将会往以下两个方向发展:

一、提升单柜的供电能力。随着CPU芯片和GPU的单卡单芯片功耗的飞速增加,服务器整机功耗也在快速提升。如果想在单个机柜内放更多的节点,提升机柜节点密度,就要提升单柜的供电能力。在百度,40A和80A已经是常态化的单柜供电能力,目前已经面向120A及其以上在做规划。

二、增强节能减排。这一点可以通过三个方式来做到:一是芯片定制化,通过提升能耗比来降低功耗;二是提升虚拟化的能力,通过提升利用率来充分利用计算资源;三是要与散热技术相结合,推动服务器散热方式从风冷模式走向液冷模式,推动数据中心从风冷数据中心向液冷数据中心转变,这是未来的趋势。

散热设计

百度与英特尔在散热技术方面的合作,有三个阶段:

第一,基于百度高温服务器的合作。百度在自建数据中心通过提升服务器的进风口温度,让整个数据中心的基础设施制冷能耗大幅降低,在服务器性能并未降低的同时,实现冷机运行时间和制冷系统采购成本的减少。

第二,基于天蝎整机柜冷板式液冷的技术合作,今年百度在ODCC峰会已经推出了面向整个行业首个开源的冷板式液冷整机柜标准。

第三,面向未来的浸没式液冷的技术合作,现在百度和英特尔正在做前期技术上的预研,例如架构设计、标准制定、详细规格定义等。

近年来随着CPU、GPU算力的快速提升,服务器的功耗在快速的增长。目前百度的服务器仍然是以风冷散热为主,除了传统的铜散热片、铝散热片方式外,现在还有新的风冷解决方案,例如虹吸散热、3DVC散热技术等,但是与液冷相比,对于数据中心而言,整个风冷系统的制冷高功耗是其当前面临的最大挑战之一,因此风冷全面转向液冷已经成为绿色节能的必然趋势。

据了解,2022年,百度和英特尔就未来数据中心在软硬件一体化协同、软件在未来云业务中大规模部署、调动、敏捷开发等方面已经达成共识。未来,百度和英特尔将继续围绕CPU、GPU液冷散热技术进行深度的合作,推进冷板式液冷的规模化落地以及浸没式液冷的试点,助力百度数据中心从风冷转向液冷。百度将会基于英特尔的CPU、GPU以及IPU相关产品,与英特尔在产品技术、行业解决方案和行业标准制定以及产业生态等多方面进行全方位合作。