Arm Intros Cortex-A320 Armv9 CPU dla aplikacji IoT i Edge AI

cyberfeed.pl 5 godzin temu

Nowa Cortex-A320 ARM reprezentuje swój pierwszy ultra-wydajny procesor przy użyciu zaawansowanej architektury ARMV9 poświęconej potrzebom aplikacji IoT i AI. Procesor osiąga ponad 50% wyższą wydajność w porównaniu z Cortex-A520 poprzez kilka optymalizacji mikroarchitektury, wraz z wąską ścieżką danych i dekodowania danych, gęsto bankowymi pamięciami L1 i plikiem rejestru liczb całkowitych o zmniejszonym porcie. Zapewnia również 30% poprawę wydajności skalarnej w porównaniu z jego poprzednikiem, Cortex-A35, za pośrednictwem wydajnych predyktorów gałęzi, usprawnień systemów pamięci i systemu pamięci.

Cortex-A320 to jednoosobowy procesor na zamówienie z 32-bitowym pobieraniem instrukcji i 8-etapowym rurociągiem. Procesor oferuje skalowalność poprzez obsługę konfiguracji jednordzeniowych do czterordzeniowych. Posiada DSU-120T, usprawnioną jednostkę współdzieloną dynamiczną (DSU), która umożliwia klastry tylko kory A320. Cortex-A320 obsługuje do 64 KB Butów L1 i do 512 kb L2, z 256-bitowym interfejsem Axi Axi do pamięci zewnętrznej. Pamięć podręczna L2 i L2 TLB można udostępnić między procesorami Cortex-A320. Jednostka przetwarzania wektorów, która implementuje technologie Neon i Sve2 SIMD (pojedyncze instrukcje, wiele danych), może być prywatna w jednym złożonym kompleksie lub współdzielona między rdzeniami w dwurdzeniowych lub czterordzeniowych implementacjach.

Cortex-A320 ma nie tylko rynek IoT, ale także sektor sztucznej inteligencji i jego cel, integrując ulepszenia architektury ARMV9 w przetwarzaniu wektora neonu i SVE2. Procesor osiąga dziesięciokrotny wzrost przetwarzania ML w porównaniu z Cortex-A35 i choćby sześciokrotnie wyższą ogólną wydajność ML niż powszechnie stosowany Cortex-A53. ARM Cortex-A320 obsługuje nowe typy danych, takie jak BF16 oraz instrukcje mnożenia produktu DOT i MATRIX, co czyni go najbardziej wydajnym procesorem Cortex-A dla aplikacji ML.

Source link

Idź do oryginalnego materiału