Intel „Granite Rapids-UCC” napędzający Xeon 6 6980P Szczegóły: Możliwe do 132 rdzeni

cyberfeed.pl 1 miesiąc temu


Firma Intel ogłosiła we wtorek wariant ultra core-count (UCC) swojej mikroarchitektury procesorów serwerowych „Granite Rapids”, wprowadzając nowe jednostki SKU serii Xeon 6 z liczbą rdzeni P sięgającą 128 rdzeni/256 wątków na gniazdo. Mikroarchitektura „Granite Rapids” wykorzystuje rdzenie wydajnościowe „Redwood Cove”. Są one nowsze niż rdzenie „Raptor Cove” zasilające „Sapphire Rapids”, a wersja kliencka tych rdzeni zasila procesory Core Ultra 1-series „Meteor Lake”. Wersja serwerowa „Redwood Cove” jest wyposażona w 112 KB pamięci podręcznej L1 (64 KB L1I i 48 KB L1D) oraz 2 MB dedykowanej pamięci podręcznej L2. Wersja serwerowa „Redwood Cove” jest zoptymalizowana pod kątem układu rdzeni połączeń siatkowych na trzech kafelkach obliczeniowych tworzących „Granite Rapids-UCC”, przy czym każdy rdzeń jest wyposażony w segment o rozmiarze 3,93 MB z 168 MB współdzielonej pamięci podręcznej L3 kafelka.

Być może największą zmianą między wariantami klienckimi i serwerowymi „Redwood Cove” są zestawy instrukcji AMX-FP16 i AVX512-FP16. 128-rdzeniowy procesor Xeon 6 6980P opiera się na pakiecie „Granite Rapids-UCC”, który ma trzy kafelki obliczeniowe po 44 rdzenie każdy i 4-kanałowy interfejs pamięci każdy. Trzy kafelki obliczeniowe mają spójność pamięci podręcznej, więc każdy rdzeń na dowolnym z trzech kafelków może skorzystać z 12-kanałowego interfejsu pamięci DDR5 procesora. Pakiet ma również dwa kafelki SoC z 48-ścieżkowym kompleksem głównym PCIe Gen 5 lub CXL 2.0, co daje łącznie 96 ścieżek. Procesor ma 6 łączy UPI dla maszyn wielogniazdowych i obsługuje konfigurację do 2P na system, co daje maksymalną liczbę rdzeni 256 P-rdzeni. Każdy z trzech kafelków obliczeniowych został zbudowany na węźle Intel 3 Foundry, natomiast dwa kafelki SoC – na węźle Intel 7.

W przypadku procesorów serwerowych Intel nie korzysta z tego samego systemu pomiaru mocy, co w przypadku procesorów klienckich (moc bazowa, moc turbo), ponieważ musi trzymać się standardów branżowych, którymi kierują się architekci centrów danych, dlatego stosuje płaską wartość TDP. Liderem jest Xeon 6980P z liczbą rdzeni 128/256 wątków, częstotliwością bazową 2,00 GHz, 3,20 GHz w trybie boost dla wszystkich rdzeni, maksymalną częstotliwością boost 3,90 GHz, 504 MB współdzielonej pamięci podręcznej L3 i 500 W TDP. Następny jest 6979P z konfiguracją 120 rdzeni/240 wątków, częstotliwością bazową 2,10 GHz, 3,20 GHz w trybie boost dla wszystkich rdzeni i maksymalną częstotliwością turbo 3,90 GHz. Co ciekawe, ma on taką samą pamięć podręczną L3, 504 MB, jak 6980P, a także taki sam wskaźnik TDP, wynoszący 500 W.

Xeon 6972P to interesujący SKU, ponieważ bezpośrednio konkuruje z najlepszym procesorem AMD EPYC „Genoa” z jego konfiguracją 96-rdzeniową/192-wątkową. Taktowanie wynosi 2,40 GHz bazowo, 3,50 GHz w trybie boost dla wszystkich rdzeni i 3,90 GHz w trybie boost dla maksymalnych częstotliwości. Pamięć podręczna L3 jest nieznacznie zmniejszona do szanowanych 480 MB, ale TDP pozostaje na poziomie 500 W. 6952P ma tę samą konfigurację 96-rdzeniową/192-wątkową, ale z niższymi prędkościami taktowania i TDP, z bazą 2,10 GHz, 3,20 GHz w trybie boost dla wszystkich rdzeni i 3,90 GHz w trybie boost dla maksymalnych częstotliwości. TDP jest zmniejszone do 400 W.

Xeon 6960P powinien przypaść do gustu rynkowi serwerów obliczeniowych dzięki równowadze między liczbą rdzeni a szybkością taktowania. Ma konfigurację 72-rdzeniową/144-wątkową, ale najwyższe szybkości taktowania w ofercie. Obejmuje to częstotliwość bazową 2,70 GHz, 3,80 GHz w trybie boost dla wszystkich rdzeni i 3,90 GHz w trybie boost dla maksymalnego. Rozmiar pamięci podręcznej L3 wynosi 432 MB, a TDP zostało podniesione do 500 W, aby obsługiwać szybkości taktowania.

Wszystkie pięć wymienionych powyżej modeli obsługuje 2P, mają 12-kanałowe interfejsy pamięci DDR5 i natywne prędkości pamięci DDR5-6400 przy użyciu konwencjonalnych modułów RDIMM lub DDR5-8800 przy użyciu modułów MRDIMM. Wszystkie SKU mają również 96 linii PCIe Gen 5 lub CXL 2.0. Wszystkie SKU otrzymują również te same akceleratory w pakiecie (sprzęt o stałej funkcji przyspieszający popularne rodzaje aplikacji serwerowych), które obejmują DSA (akcelerator przesyłania strumieniowego danych), IAA (akcelerator analizy w pamięci), QAT (Quick Assist Technology) i Dynamic Load Balancing (DLB).



Source link

Idź do oryginalnego materiału