Chłodzone cieczą superklastry Supermicro dla centrów danych AI zasilane systemami NVIDIA GB200 NVL72 i NVIDIA HGX B200

cyberfeed.pl 5 godzin temu


Supermicro, Inc., dostawca kompleksowych rozwiązań IT dla sztucznej inteligencji, chmury, pamięci masowej i 5G/Edge, przyspiesza przejście branży na centra danych chłodzone cieczą dzięki platformie NVIDIA Blackwell, aby zapewnić nowy paradygmat efektywności energetycznej dla gwałtownie zwiększone zapotrzebowanie na energię nowych infrastruktur sztucznej inteligencji. Wiodące w branży, kompleksowe rozwiązania w zakresie chłodzenia cieczą firmy Supermicro są zasilane przez platformę NVIDIA GB200 NVL72 do obliczeń eksaskalowych w jednej szafie i pod koniec czwartego kwartału rozpoczęły się pobieranie próbek w celu wybrania klientów do produkcji na pełną skalę. Ponadto niedawno ogłoszone systemy Supermicro X14 i H14 4U chłodzone cieczą oraz systemy 10U chłodzone powietrzem są gotowe do produkcji produkcyjnej dla systemu NVIDIA HGX B200 z 8 procesorami graficznymi.

„Napędzamy przyszłość zrównoważonego przetwarzania AI, a nasze rozwiązania AI chłodzone cieczą są gwałtownie wdrażane w niektórych z najbardziej ambitnych projektów w zakresie infrastruktury AI na świecie, obejmujących ponad 2000 szaf chłodzonych cieczą dostarczonych od czerwca 2024 r.” – powiedział Charles Liang, prezes i dyrektor generalny Supermicro. „Kompleksowe rozwiązanie Supermicro w zakresie chłodzenia cieczą, wyposażone w platformę NVIDIA Blackwell, uwalnia moc obliczeniową, opłacalność i efektywność energetyczną procesorów graficznych nowej generacji, takich jak te, które są częścią NVIDIA GB200 NVL72, komputer eksaskalowy umieszczony w jednej szafie. Bogate doświadczenie Supermicro we wdrażaniu infrastruktury AI chłodzonej cieczą, wraz z kompleksowymi usługami na miejscu, oprogramowaniem do zarządzania i globalnymi możliwościami produkcyjnymi, zapewnia klientom wyraźną przewagę w przekształcaniu centrów danych dzięki najpotężniejszych i najpotężniejszych rozwiązań. zrównoważone rozwiązania AI.”

Chłodzone cieczą SuperClusters firmy Supermicro dla systemów opartych na platformie NVIDIA GB200 NVL72 są wyposażone w nowe zaawansowane jednostki dystrybucji chłodziwa (CDU) montowane w szafie lub w rzędzie oraz niestandardowe płyty chłodzące zaprojektowane dla tacy obliczeniowej mieszczącej dwa superchipy NVIDIA GB200 Grace Blackwell Superchip w obudowie 1U współczynnik kształtu. Karta NVIDIA GB200 NVL72 firmy Supermicro zapewnia eksaskalowe możliwości obliczeniowe AI w jednej szafie dzięki kompleksowemu rozwiązaniu chłodzenia cieczą firmy Supermicro. Rozwiązanie stelażowe obejmuje 72 procesory graficzne NVIDIA Blackwell i 32 procesory NVIDIA Grace, połączone siecią NVLink piątej generacji firmy NVIDIA. System NVIDIA NVLink Switch zapewnia całkowitą komunikację GPU z szybkością 130 terabajtów na sekundę (TB/s) przy wyjątkowo małych opóźnieniach, zwiększając wydajność AI i obciążeń obliczeniowych o wysokiej wydajności (HPC). Ponadto Supermicro obsługuje niedawno ogłoszoną platformę NVIDIA GB200 NVL2, system o wysokości 2U chłodzony powietrzem, zawierający ściśle połączone dwa procesory graficzne NVIDIA Blackwell i dwa procesory NVIDIA Grace, który nadaje się do łatwego wdrażania przy różnorodnych obciążeniach, takich jak duże wnioskowanie LLM, RAG, przetwarzanie danych i Aplikacje HPC.

Wiodące systemy chłodzone cieczą 4U firmy Supermicro i nowe systemy chłodzone powietrzem 10U obsługują teraz system NVIDIA HGX B200 z 8 procesorami graficznymi i są gotowe do produkcji. Nowo opracowane płyty chłodzące i moduł dystrybucji chłodziwa w szafie o mocy 250 kW maksymalizują wydajność i efektywność systemów z 8 procesorami graficznymi, zapewniając 64 procesory graficzne NVIDIA Blackwell o mocy 1000 W i 16 procesorów o mocy 500 W w pojedynczej szafie 48U. Można zainstalować i w pełni zintegrować do 4 nowych systemów chłodzonych powietrzem o wysokości 10U w szafie o tej samej gęstości co poprzednia generacja, zapewniając jednocześnie do 15x wnioskowania i 3x wydajność treningu.

Oprogramowanie SuperCloud Composer, wszechstronna platforma zarządzania centrami danych firmy Supermicro, zapewnia zaawansowane narzędzia do monitorowania istotnych informacji na temat systemów i stojaków chłodzonych cieczą, jednostek dystrybucji chłodziwa i wież chłodniczych, w tym ciśnienia, wilgotności, stanu pomp i zaworów i nie tylko. Moduł Liquid Cooling Consult Module (LCCM) firmy SuperCloud Composer optymalizuje koszty operacyjne i zarządza integralnością centrów danych chłodzonych cieczą.

Skalując infrastrukturę dla wielobiliardowych parametrów modeli AI, Supermicro jest liderem we wdrażaniu innowacji sieciowych zarówno dla InfiniBand, jak i Ethernet, w tym NVIDIA BlueField -3 SuperNIC i NVIDIA ConnectX -7 przy 400 Gb/s, NVIDIA ConnectX -8, Spectrum – 4 i NVIDIA Quantum-3, aby umożliwić pracę sieciową 800 Gb/s na platformie NVIDIA Blackwell. Karta NVIDIA Spectrum-X Ethernet z klastrami systemowymi NVIDIA HGX H100 i H200 firmy Supermicro o wielkości 4U chłodzonymi cieczą i chłodzonymi powietrzem o wielkości 8U, obsługuje w tej chwili jedno z największych dotychczas wdrożeń sztucznej inteligencji.

Od sprawdzenia koncepcji (PoC) po wdrożenie na pełną skalę, Supermicro to punkt kompleksowej obsługi zapewniający wszystkie niezbędne technologie, chłodzenie cieczą, rozwiązania sieciowe i usługi instalacyjne na miejscu. Supermicro zapewnia kompleksowy, samodzielnie zaprojektowany ekosystem chłodzenia cieczą, obejmujący specjalnie zaprojektowane płyty chłodzące zoptymalizowane pod kątem różnych procesorów graficznych, procesorów i modułów pamięci, wraz z wieloma współczynnikami kształtu i pojemności CDU, kolektorami, wężami, złączami, wieżami chłodniczymi, oraz oprogramowanie do monitorowania i zarządzania. To kompleksowe rozwiązanie bezproblemowo integruje się z konfiguracjami na poziomie szafy, znacznie zwiększając wydajność systemu, łagodząc dławienie termiczne i jednocześnie zmniejszając zarówno całkowity koszt posiadania (TCO), jak i wpływ operacji centrum danych na środowisko w erze sztucznej inteligencji.

Supermicro na światowym szczycie OCP 2024

  • Nowy system X14 4U chłodzony cieczą z systemem NVIDIA HGX B200 8-GPU
  • Platforma SuperCluster NVIDIA GB200 NVL72 firmy Supermicro 4
  • System H13 4U chłodzony cieczą z systemem NVIDIA HGX H200 8-GPU
  • System X14 JBOF
  • X14 1U CloudDC z konstrukcją OCP DC-MHS

Dowiedz się więcej na stoisku OCP Global Summit nr 21, San Jose, Kalifornia, 15–17 października 2024 r.



Source link

Idź do oryginalnego materiału