Odsłonięta matryca NVIDIA GB202 „Blackwell” pokazuje ogromną konfigurację rdzenia 24 756 CUDA

cyberfeed.pl 1 dzień temu

W Internecie pojawił się wycinek GB202 firmy NVIDIA, krzemu napędzającego kartę RTX 5090, dostarczając szczegółowego wglądu w Architektura „Blackwell”. układ fizyczny. Zdjęcia z adnotacjami, udostępnione przez analityka sprzętu Kurnala i dostarczone przez dyrektora generalnego ASUS China, Tony’ego Yu, porównują GB202 z jego poprzednikiem AD102 i przedstawiają najważniejsze komponenty architektoniczne. W centralnym obszarze kości znajduje się 128 MB pamięci podręcznej L2 (96 MB włączone w RTX 5090), otoczonej interfejsami pamięci. Osiem 64-bitowych kontrolerów pamięci obsługuje 512-bitowy interfejs GDDR7, z fizycznymi interfejsami umieszczonymi wzdłuż górnej, lewej i prawej krawędzi kości. Centralną pamięć podręczną otacza dwanaście klastrów przetwarzania grafiki (GPC). Każdy GPC zawiera osiem klastrów przetwarzania tekstur (TPC), przy czym każdy GPC mieści 16 multiprocesorów strumieniowych (SM). Pełna konfiguracja matrycy umożliwia wykorzystanie 24 576 rdzeni CUDA rozmieszczonych jako 128 rdzeni na SM w 192 SM. Ponieważ RTX 5090 oferuje „tylko” 21 760 rdzeni CUDA, oznacza to, iż pełna pamięć GB202 jest zarezerwowana dla procesorów graficznych stacji roboczych.

Projekt SM obejmuje cztery plasterki współdzielące 128 KB pamięci podręcznej L1 i cztery jednostki mapowania tekstur (TMU). Poszczególne segmenty SM zawierają dedykowane pliki rejestrów, pamięci podręczne instrukcji L0, programy planujące warp, jednostki magazynu ładowania i jednostki funkcji specjalnych. Centralnym elementem układu matrycy jest pionowy pasek zawierający elementy przetwarzające media — jednostki NVENC i NVDEC — biegnący od góry do dołu. Implementacja RTX 5090 umożliwia korzystanie z trzech z czterech dostępnych koderów NVENC i dwóch z czterech dekoderów NVDEC. Matryca zawiera dwanaście bloków silnika rastrowego/3D FF do przetwarzania geometrii. Na dolnej krawędzi znajdują się elementy interfejsu PCIe 5.0 x16 i kontrolera wyświetlacza. Pomimo znacznych rozmiarów, GB202 pozostaje mniejszy niż poprzednie matryce NVIDIA GH100 i GV100, które przekraczały 814 mm². Każdy SM integruje specjalistyczny sprzęt, w tym nowe rdzenie Tensor piątej generacji i rdzenie RT czwartej generacji, co daje łącznie 192 rdzenie RT, 768 rdzeni Tensor i 768 jednostek teksturujących.

Source link

Idź do oryginalnego materiału