Ein Überblick
In der sich stetig weiterentwickelnden Landschaft von Rechenzentren und Hochleistungsrechnerinfrastrukturen für KI-Anwendungen ist die Kühleffizienz zu einem zentralen Anliegen für Ingenieure geworden, die sowohl Leistung als auch Energieverbrauch optimieren wollen. Angesichts der steigenden Anforderungen von KI, maschinellem Lernen und Mehrkernprozessoren stoßen herkömmliche Luftkühlungsmethoden an ihre Grenzen.
Parallel dazu entwickeln sich Trends wie beispielsweise vertikale Stromversorgung (VPD) werden eingesetzt, um die Verluste im Stromversorgungsnetz (PDN) zu minimieren. Dadurch lassen sich Module an spezifische Prozessor- und Serverkonfigurationen anpassen. Das flache Design von VPD ergänzt die direkte Flüssigkeitskühlung (D2C), die bei den Leistungsanforderungen von KI-Servern unerlässlich ist. Dieser Ansatz unterscheidet sich von der herkömmlichen seitlichen Anordnung von DC/DC-Wandlern, die typischerweise für Zwangsluftkühlung und eine minimale Stellfläche ausgelegt sind.
Die Zwangsluftkühlung ist bei niedrigeren Leistungsdichten noch immer verbreitet, weist aber erhebliche Einschränkungen auf, wie den Bedarf an großen Kühlkörpern und die Abführung der heißen Abluft, die benachbarte Komponenten beeinträchtigen kann. Die Platzierung von Prozessoren und Kühlkörpern in der Nähe des Luftauslasses hilft zwar, schränkt aber die Flexibilität des Platinendesigns ein.
Im Gegensatz dazu bietet die Flüssigkeitskühlung mehrere Vorteile, darunter eine höhere Wärmetransporteffizienz, eine kleinere Systemgröße und einen geringeren Energieverbrauch bzw. niedrigere Betriebskosten. Sie macht zudem weniger zuverlässige Lüfter überflüssig, obwohl ein zentraler Wärmetauscher weiterhin erforderlich ist. Zwar erfordert die Flüssigkeitskühlung höhere Anfangsinvestitionen und kann aufgrund ihrer zentralen Bauweise die Systemverfügbarkeit verringern, sie verbessert die Kühlleistung jedoch deutlich.
Abbildung 1: Vertikale Stromversorgung eines Prozessors
Ein hybrides Flüssigkeitskühlsystem, auch bekannt als Direktkühlung des Chips, leitet die Wärme vom Prozessor an eine Kühlplatte mit Flüssigkeitskanälen (typischerweise Wasser) ab. Dieses einphasige System bietet eine deutlich verbesserte Wärmeabfuhr gegenüber der Luftkühlung. Mit fluorkohlenstoffbasierten Flüssigkeiten in einem zweiphasigen System lassen sich weitere Leistungssteigerungen erzielen, da dieses System dank der Verdampfungswärme eine etwa 100-fach höhere Wärmeaufnahme ermöglicht. Obwohl diese Methode teurer ist, verursacht sie im Falle von Leckagen weniger Schäden und stellt daher trotz der höheren Kosten eine praktikable Option dar.
Die Entwicklung der direkten Flüssigkeitskühlung Der Fokus liegt auf zwei Haupttechnologien: Mikrokanal- und Mikrokonvektionskühlung. Die Mikrokanalkühlung verteilt die Wärme gleichmäßig über die Oberfläche, stößt jedoch bei leistungsstärkeren Chipsätzen an ihre Grenzen. Dies führt zu Designs mit engeren Kanälen und höheren Filtrationsanforderungen, was sich auf den Betrieb von Rechenzentren auswirkt. Die Mikrokonvektionskühlung, auch Mikrostrahlkühlung genannt, zielt hingegen auf spezifische Hotspots auf Prozessoren ab. Sie bietet einen geringeren Wärmewiderstand und vermeidet die mit Mikrokanälen verbundenen Druckprobleme, wodurch sie für Hochleistungsanwendungen effektiver ist. JetCool, ein Unternehmen der Firma Flex, bietet D2C-Flüssigkeitskühlmodule an, die mit Arrays kleiner Flüssigkeitsstrahlen arbeiten, welche die Hotspots auf Prozessoren präzise anvisieren und so die Kühlleistung von Hochleistungselektronik auf Chip- oder Geräteebene revolutionieren.
Die Immersionskühlung, bei der das gesamte System in eine dielektrische Flüssigkeit eingetaucht wird, ist eine weitere Option. Sie bietet eine ausgezeichnete Kühlleistung, jedoch schränken Bedenken hinsichtlich Umweltauswirkungen, Leckagen und der Tatsache, dass das System einen einzigen Ausfallpunkt darstellt, ihre Anwendung ein. Die höhere Dielektrizitätskonstante der Flüssigkeit erhöht zudem die Streukapazität, was hochfrequente Signale beeinflussen kann.
Kurzinfo zur Flüssigkeitskühlung
- Im Jahr 2023 Das US-Energieministerium hat $40 Millionen bereitgestellt Zur Unterstützung innovativer Kühltechnologien für Rechenzentren. Diese Projekte zielen darauf ab, die Grenzen der Energieeffizienz und Nachhaltigkeit in Rechenzentren zu erweitern.
- Traditionelle Rechenzentren kommen mit rund 12 kW pro Rack aus, aber bei KI-Rechenzentren ist ein dramatischer Anstieg zu verzeichnen: Aktuelle Ultra-High-Density-Racks verbrauchen 85 kW pro Schrank. Zukunftsprognosen deuten darauf hin, dass dies steigen könnte. auf 200 kW bis 250 kW pro Rack, da die Anforderungen an KI-Workloads steigen.
- Eine höhere Rackdichte bedeutet zwar größere Datenkapazität, aber auch höheren Energieverbrauch und zusätzliche Wärmeentwicklung. Rechenzentren arbeiten optimal zwischen zwei Dichten. 21 und 24 Grad Celsius, Daher muss jede Erhöhung der Rackdichte mit einer verbesserten Kühlung einhergehen.
- Kühlsysteme verbrauchen 25–40% der Energie in Rechenzentren. Mit steigender Rackdichte wird die Auslegung von Kühlsystemen eine immer wichtigere Rolle für die Aufrechterhaltung der Gesamteffizienz spielen.
Abbildung 2: Umfrage des Uptime Institute zu den in Rechenzentren/Colocation-Einrichtungen verwendeten Arten der direkten Flüssigkeitskühlung.
Glossar
Siedepunkt:
Die Temperatur, bei der eine Flüssigkeit zu Dampf wird; entscheidend für den Phasenübergang bei der Zweiphasenkühlung.
Kühlplatte:
Kühlplatten bilden das Herzstück von Flüssigkeitskühlsystemen. Diese Metallplatten werden direkt auf CPUs und GPUs montiert. Kühlmittel fließt durch Kanäle in den Kühlplatten, nimmt die Wärme auf und transportiert sie von den Komponenten ab.
Kondensator:
Bauteil, in dem verdampftes Kühlmittel Wärme abgibt und wieder zu einer Flüssigkeit kondensiert.
Kühlmittel:
Die Flüssigkeit, die dazu dient, Wärme von den Bauteilen aufzunehmen und abzuleiten, üblicherweise Wasser, Glykolgemische oder dielektrische Flüssigkeiten.
Dielektrische Flüssigkeit:
Ein nichtleitendes Kühlmittel, das elektrische Kurzschlüsse und Korrosion verhindert.
Durchflussrate:
Das Volumen des Kühlmittels, das durch ein System strömt, wird typischerweise in Litern pro Minute gemessen.
Wärmetauscher:
Ein Gerät, das Wärme vom Kühlmittel auf ein anderes Medium überträgt.
Kühlkörper:
Das passive Bauteil, das Wärme ableitet, indem es sie über eine größere Oberfläche verteilt.
Flüssigkeitskreislauf:
Ein geschlossener Kühlmittelkreislauf in einem Kühlsystem.
Verteiler:
Die Verteiler dienen als Verteilerzentren für das Kühlmittel innerhalb des Gestells und steuern den Kühlmittelfluss zu und von den Kühlplatten, um eine gleichmäßige Verteilung zu gewährleisten.
Schnellkupplungen:
Spezielle Steckverbinder, die ein einfaches und schnelles Verbinden oder Trennen der Kühlmittelleitungen ermöglichen.
Wärmewiderstand:
Ein Maß für die Fähigkeit eines Materials, dem Wärmefluss zu widerstehen; ein geringerer Widerstand bedeutet eine bessere Wärmeübertragung.
Wärmeleitmaterial (TIM):
Material zur Verbesserung der Wärmeleitfähigkeit zwischen einem Chip und einem Kühlkörper oder einer Kühlplatte.
Pumpe:
Vorrichtung zur Umwälzung von Kühlmittel im System.
Vertikale Stromversorgung:
Eine Methode zur Minimierung von Leistungsverlusten durch Positionierung der Leistungsmodule direkt über oder unter dem Prozessor.