电力与计算：为人工智能时代重构数据中心

在人工智能数据中心时代，电力和计算基础设施的设计、管理和部署变得密不可分。电力、计算和冷却组件越来越多地被作为一个集成系统进行规划和优化。然而，由于人工智能工作负载需要高密度的计算机架，电力组件必须进行拆分，以便为更密集的服务器腾出空间——而且它们必须比以往更高效地提供更多电力。仅从额定功耗来看，兆瓦级GPU机架产生的热量大约是满载CPU机架的50倍。

“边车”出现了

由开放计算项目 (OCP) 开发的 Open Rack v3 (ORv3) 标准旨在支持更高的功率密度并实现诸如液冷等高级功能。灵活、可扩展的机架这种机架能够适应不断发展的人工智能和高性能计算工作负载，并且兼容各种IT设备。在这种情况下，每个集成机架都是一个“单元”。但1兆瓦机架的出现，标志着颠覆传统模式的革新。

ORv3机架最初的设计容量为每机架18千瓦至36千瓦，至今仍是许多工作负载的黄金标准，但它们并非为即将到来的兆瓦级机架而设计。规划1兆瓦的IT机架已超出标准ORv3规范的极限，需要进行重大设计修改，并使用侧挂机架来管理电源和冷却需求。

正因如此，一些超大规模数据中心运营商正在OCP的支持下合作开发Mt. Diablo标准，例如新的电源机架规范，该规范支持高压直流电源基础设施和每个机架1兆瓦的IT负载，并将电源、冷却和IT分离，从而提高每项功能的利用率。与以往各个机架各自独立运行不同，冷却液分配单元（CDU）、电源分配单元（PDU）和IT机架（或多个机架）组成一个整体单元，共同支持工作负载。CDU和PDU相当于IT机架的“边车”。 Flex人工智能基础设施平台就是一个绝佳的例子，它将电源、冷却和计算统一到预先设计的模块化参考设计中，用于下一代数据中心。

墙壁倒塌了

随着数据中心转向使用更高的电压和先进的液体冷却技术为了支持 1 MW 机架，电力转换、电力分配以及空气冷却环境所需的设备所需的空间将会减少。

一场彻底的变革正在进行中改造人工智能数据中心基础设施十年之内，独立式电源柜和配电单元 (CDU) 将释放 IT 机架中的计算空间，这意味着处理工作负载所需的 IT 机架数量将减少，密度将提高，性能也将提升。此外，不再需要每个机架都配备独立的电源和冷却系统，侧柜可以同时为多个专用计算机架供电和散热。这将释放出更多空间，为进一步的创新提供广阔空间。

随着IT机架、电力和冷却设备变得更加集中、强大和高效，分隔灰色空间（配电室）和白色空间（数据机房）的墙壁正在被拆除。这种转变意义深远。据我们估计，下一代数据中心只需比现在减少90%的空间就能实现相同的功能，而且效率更高。

超大规模数据中心运营商将如何利用新增的可用空间？他们很可能会提升千兆级数据中心的计算密度，但这还有待观察。既然在更小的空间内可以实现更多功能，他们也可能选择缩小数据中心规模，降低资本支出。无论如何，这种转型既是推动因素，也是机遇，我们很高兴能与他们合作，共同推进人工智能时代的基础设施创新以及相关产品的研发。我们大胆预测：即使人工智能时代的数据中心对电力、计算和冷却的需求不断增长，也能实现更高的效率、更低的运营成本和更强的韧性——这的确是一次积极的转型。

想了解更多？
敬请关注我们在 OCP 2025 全球峰会上的精彩演讲，我们将深入探讨这一话题。

立即观看

电力与计算：为人工智能时代重构数据中心

“边车”出现了

墙壁倒塌了

想了解更多？敬请关注我们在 OCP 2025 全球峰会上的精彩演讲，我们将深入探讨这一话题。

保持联系

想了解更多？
敬请关注我们在 OCP 2025 全球峰会上的精彩演讲，我们将深入探讨这一话题。