联系我们

从电网到芯片:优化人工智能数据中心的电力

发表于
3 2025 年 7 月

解决数据中心电力系统架构的局限性

数据中心运营商需要更多电源,并能够高效地将电力从电网分配到机房、机架,最终输送到芯片。与此同时,运营商面临着越来越大的压力,需要降低计算基础设施(包括电源、配电系统和冷却解决方案)的资本支出。降低能源成本和减少环境影响同样至关重要。随着运营商致力于通过基础设施优化来提高投资回报率并获得竞争优势,最大化电力转换效率和最小化运营成本已成为重中之重。.

然而,电源系统架构面临一些重大局限性。例如,芯片级电压降低、电流增大的趋势意味着最终转换级必须非常靠近负载,以确保最小的电压降和连接电感引起的干扰,并满足最新处理器更高的负载瞬态要求。此外,将电力电子器件放置在芯片附近会带来散热管理方面的挑战,尤其是在空间本就有限的情况下。.

处理器端电压调节模块的上游电源转换采用分布式电源方案分阶段完成。这种方案通常包括接入市电的交流/直流转换器、备用系统以及带有相关电源转换器的中间总线,这些转换器的工作电压能够将电流控制在可控范围内。这些阶段有助于最大限度地减少互连尺寸和成本、降低功率损耗以及系统电压降。.

设计最佳电源架构还包括将电源转换器集成到数据中心的冷却基础设施中,以及决定在电源转换过程中哪些区域采用电气隔离,以降低安全风险和接地回路。最终,物理空间限制和散热要求(由功率密度和效率决定)在电源设备的部署位置和方式上起着决定性作用。.

确定数据中心配电的最佳解决方案

数据中心的配电系统涵盖了从传统交流电网变压器和开关设备到机械母线和兆赫兹 (MHz) 高频直流/直流转换器等各种技术。由于可选方案众多,确定最有效的配置方案可能很困难,而且在某些情况下,还容易受到主观判断的影响。.

例如,系统架构师可能倾向于以 800 伏的电压分配电力。直流 而不是 48 伏直流 为了降低电流水平、最大限度地减少功率损耗和电压降,并可以使用更小、更经济的母线和电缆,需要更高的电压。然而,更高的电压也带来了更严格的合规要求,需要额外的绝缘、电气隔离和认证流程。它还提高了人员安全标准,只允许具备相应资质的工程师和技术人员操作此类系统。相比之下,48V 的母线电压则更为安全。直流 由于行业广泛采用和成熟的组件选择,以及规模经济带来的成本优势,它们仍然是热门之选,并提供多种采购渠道。此外,它们本质上也是安全的,因为它们的电压低于安全特低电压 (SELV) 限值。.

另一个关键的设计考虑因素是中间母线电压是否需要调节。非调节的隔离式设计可以提供更高的效率和更好的功率密度,但通常需要仔细选择下游转换器以确保兼容性。一些系统采用混合调节方案,允许母线电压在预设范围内波动,只有当电压超出这些阈值时才启用主动控制。这种方法既能保持高效率,又能为下游功率转换提供更大的灵活性。.

实现数据中心端到端的电源转换优化

确定从电网到芯片的最佳电源转换和分配方案需要采用整体方法。传统的电源树架构不太适合满足下一代系统的需求,因为转换阶段之间的边界正在发生变化。例如,DC/DC 转换器现在通过垂直电源传输 (VPD) 技术与处理器在电气和热方面紧密集成,这些技术是针对各个处理器的独特引脚配置量身定制的。.

当电源转换链的组件来自多个供应商时,不兼容的风险就会增加。每个供应商都可能推广其专有技术,这些技术与其他供应商的技术无法无缝衔接,从而增加构建完全兼容系统的难度。这凸显了与经验丰富且值得信赖的电源转换合作伙伴合作的价值,这些合作伙伴能够提供端到端的集成解决方案——确保各组件之间的兼容性,同时优化性能、降低成本,并提供长期支持和指导。.

Flex 提供多种 数据中心电源和冷却产品, Flex 提供包括 DC/DC 稳压器和总线转换器在内的多种解决方案,以及中低压 AC/DC 转换、配电、关键备用电源系统和机架级及芯片级冷却解决方案。此外,Flex 还提供定制设计方案,包括垂直供电配置和仿真工具,用于在实施前对系统进行建模。同时,Flex 还提供全面的监控和支持,以确保持续的性能和可靠性。.

BMR316

随着数据中心容量需求持续快速增长,数据中心运营商需要值得信赖的合作伙伴,不仅能够提供产品,更能提供完整、可扩展的解决方案。Flex 在设计、产品、制造、系统集成和供应链管理方面拥有深厚的专业知识,能够帮助数据中心高效扩展,满足不断变化的性能需求,并可根据需要随时上线容量。从现有设施到新建项目,在全球范围内快速可靠地部署下一代电力和冷却基础设施,如今已成为数据中心韧性的关键因素。.

垂直供电提升效率和性能

垂直电力输送 电压平面供电 (VPD) 通过提高效率和可靠性并显著降低能量损耗,帮助数据中心管理电源。传统的横向供电方式通常会导致印刷电路板 (PCB) 上出现大量功率损耗,从而增加能源成本并使散热管理更加复杂。相比之下,VPD 通过将电压调节器直接放置在高性能处理器下方来缩短电源传输路径。这种更近的距离最大限度地降低了电源层电阻,提高了电流密度,并显著降低了功率损耗。支持直接连接到处理器和 ASIC 电源引脚的 VPD 设计进一步优化了效率和性能。.

提高芯片级散热效率

虽然加速计算平台给数据中心带来了更高的电力需求,但它们产生的热量也给散热解决方案带来了巨大挑战。芯片级直接冷却技术将处理器产生的热量传递到液冷板。在数据中心,这种散热方式在热传输/排出方面显著优于强制风冷,并且使电路板设计更加灵活,无需将处理器和散热器放置在通风口附近。. JetCool,一家 Flex 公司, 并利用微喷射技术增强了这种方法,精确地针对热点,从而提高芯片级的冷却效率。.

不间断电源,智能管理

可靠且可扩展的电力供应对于确保数据中心避免停机和数据丢失,并保持高效率和安全性至关重要。电力故障、负载不平衡和低效的电力分配都可能导致严重的后果,例如服务中断、过热和设备故障。预制模块化系统,例如由……开发的系统,可以有效解决这些问题。 Anord Mardix,一家 Flex 公司,, 可以避免对数据中心扩容计划进行耗时且成本高昂的修改。.

承蒙《电子元件》杂志惠允