I chip NVIDIA Grace Hopper Superchip nel cuore dei supercomputer HPE Cray EX2500 per l'IA

I chip NVIDIA Grace Hopper Superchip nel cuore dei supercomputer HPE Cray EX2500 per l'IA

HPE ha annunciato il lancio di nuovi supercomputer della serie Cray EX2500 dotati del processore NVIDIA Grace Hopper Superchip e pensati specificamente per l'addestramento delle intelligenze artificiali

di pubblicata il , alle 17:11 nel canale Device
HPENVIDIAintelligenza artificiale
 

Si fa molto parlare dell'arrivo dell'architettura ARM nel mondo dei personal computer, intesi qui in senso generale e non nel classico binomio PC/Mac, e per buone ragioni: i processori ARM appaiono più efficienti rispetto ai tradizionali x86, offrendo dunque prestazioni simili ma con minori consumi (basti vedere i processori Apple o gli Snapdragon Elite X). Ha fatto un certo rumore anche l'annuncio del Grace Hopper Superchip da parte di NVIDIA, con la promessa di prestazioni due volte superiori alle CPU AMD e Intel a parità di consumi. I produttori come HPE hanno teso l'orecchio e il risultato è il nuovo HPE Cray EX2500, un supercomputer pensato per gestire le applicazioni di intelligenza artificiale.

HPE Cray EX2500: un supercomputer al servizio dell'IA

Il nuovo HPE Cray EX2500 è pensato specificamente dall'azienda per l'intelligenza artificiale, tanto che l'acronimo "IA" viene impresso sull'armadio rack che lo contiene. Al suo interno troviamo server dotati ciascuno di quattro processori NVIDIA GH200 Grace Hopper Superchip con 72 core ARM e 624 GB di memoria ad alta velocità. In totale, dunque, troviamo 288 core e 2,3 TB di memoria per ciascun blade. HPE afferma che è possibile inserire migliaia di questi server in una singola installazione. Il raffreddamento avviene a liquido.

La connessione tra i nodi avviene tramite HPE Slingshot, una soluzione proprietaria pensata specificamente per i supercomputer e in grado di raggiungere velocità di 200 Gbps, con una capacità di ciascuna porta di gestire fino a 1,2 miliardi di pacchetti al secondo in totale (600 milioni per direzione). Slingshot è progettato specificamente per gestire al meglio la congestione e un numero elevatissimo di porte mantenendo alte le prestazioni, e risulta dunque ideale per questo tipo d'impiego.

HPE non scommette solo sull'hardware, però, e punta i riflettori anche sulle soluzioni software che offre insieme ai nuovi Cray EX2500: troviamo infatti l'HPE Machine Learning Development Environment, l'HPE Cray Programming Environment e, inevitabilmente, anche il software NVIDIA AI Enterprise.

Si tratta, naturalmente, di una soluzione di altissimo livello e per questo HPE la orienta verso il pubblico, le istituzioni di ricerca, le università e le grandi imprese che abbiano bisogno di effettuare l'addestramento dei modelli di IA, dei modelli di raccomandazione basati su deep learning, e di reti neurali a grafi.

È interessante notare, dunque, come l'architettura ARM stia arrivando a insidiare anche un campo, il supercalcolo, che negli ultimi vent'anni è stato sempre più appannaggio esclusivo x86, con alcune eccezioni abbastanza isolate. L'arrivo di Fugaku nel 2021 aveva dato un segnale chiaro sul fatto che ARM avrebbe potuto competere con x86 anche in questo campo, ma l'arrivo di soluzioni "off the shelf" non può che rinforzare questo cambio di paradigma. Sarà interessante vedere come si evolverà il mercato in futuro.

2 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Mo4213 Novembre 2023, 17:49 #1
I processori GH200 e la connettività Slingshot sembrano impressionanti, ma resta da vedere se queste prestazioni si tradurranno in effettivi vantaggi tangibili per progetti non scalabili (e soprattutto a lungo termine). Le soluzioni software in-house di HPE potrebbero essere un valore aggiunto, ma rimango scettico sul fatto che la direzione attuale del mondo dell'IA e del supercalcolo proseguiranno così linearmente da permettere a tali soluzioni di venire adottate in modo capillare e graduale. Inoltre, la "sfida" all'egemonia x86 con l'architettura ARM solleva importanti domande sulla stabilità e l'efficacia di queste nuove proposte. I migliori obiettivi raramente vengono centrati quando essi si limitano ad essere delle semplici sfide di mercato.
supertigrotto13 Novembre 2023, 18:06 #2
Allo scalare delle prestazioni,nemmeno l'architettura Arm regge,per ora ha un vantaggio ma fra un paio di anni?

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^