El diseño, la gestión y la implementación de la energía eléctrica y la infraestructura computacional se están volviendo inseparables en la era de los centros de datos de IA. Los componentes de energía, computación y refrigeración se planifican y optimizan cada vez más como un sistema integrado. Sin embargo, debido a la alta densidad de racks de computación necesarios para las cargas de trabajo de IA, los componentes de energía deben desagregarse para dar cabida a servidores más densos, y deben suministrar más energía con mayor eficiencia que antes. Solo con el consumo nominal, un rack de GPU de megavatios produce aproximadamente 50 veces más calor que un rack de CPU completamente equipado.
Entran los “sidecars”
El estándar Open Rack v3 (ORv3) desarrollado por Open Compute Project (OCP) fue diseñado para soportar mayores densidades de potencia y habilitar funciones avanzadas como refrigeración líquida en racks flexibles y escalables Que podrían adaptarse a las cambiantes cargas de trabajo de IA y HPC, y son compatibles con una amplia gama de equipos de TI. En este escenario, cada rack integrado es una "unidad". Pero los racks de 1 MW representan la evolución que está rompiendo el paradigma.
Originalmente diseñados para soportar de 18 kW a 36 kW por rack, los racks ORv3 siguen siendo el estándar de referencia para muchas cargas de trabajo, pero no fueron concebidos para los racks de megavatios que se avecinan. La planificación de racks de TI de 1 MW supera los límites de las especificaciones ORv3 estándar, lo que requiere modificaciones significativas de diseño y el uso de sidecars para gestionar los requisitos de energía y refrigeración.
Por eso, algunos hiperescaladores colaboran ahora para desarrollar estándares Mt. Diablo bajo el auspicio del OCP, como una nueva especificación para racks de potencia que admite infraestructura de alimentación de CC de alto voltaje y cargas de TI de 1 MW por rack, y desagrega la potencia, la refrigeración y la TI para permitir más de cada una. En lugar de que los racks individuales sean sistemas en gran medida independientes, la unidad de distribución de refrigerante (CDU), la unidad de distribución de potencia (PDU) y el rack (o racks) de TI se convierten en la unidad colectiva que habilita las cargas de trabajo. Las CDU y las PDU son los "sidecars" del rack de TI. El nuevo Plataforma de infraestructura de IA Flex es un excelente ejemplo que unifica energía, refrigeración y computación en diseños de referencia modulares prediseñados para centros de datos de próxima generación.