Fujitsu ARM

Fujitsu A64FX: ARM arriva nei supercomputer con prestazioni di alto livello

di Riccardo Robecchi pubblicata il 07 Aprile 2020, alle 10:41 nel canale Device

Fujitsu ha presentato ufficialmente il processore A64FX, basato sull'architettura ARMv8 e in grado di esprimere prestazioni elevate con un'alta efficienza energetica grazie a soluzioni tecniche innovative

Il supercomputer "K", sviluppato da Fujitsu e messo in opera nel 2011, è stato il più potente supercomputer al mondo grazie alle sue migliaia di core basati su architettura SPARC. Nove anni dopo, e a qualche mese dallo spegnimento ufficiale di K, Fujitsu annuncia Fugaku, informalmente noto come Post-K. Il nuovo supercomputer non si posizionerà al primo posto per potenza di calcolo, ma per efficienza energetica: un risultato ottenuto grazie all'impiego dei processori Fujitsu A64FX, basati su architettura ARM e progettati con soluzioni tecniche inusuali ma in grado, stando all'azienda, di fornire prestazioni maggiori dei processori x86 con consumi minori.

Fujitsu A64FX: i processori ARM arrivano nei supercomputer

Sono passati quasi due anni dall'annuncio ufficiale di Fujitsu A64FX: il processore ha nel frattempo acquistato contorni più definiti che comprendono soluzioni tecniche inusuali e implementazioni proprietarie di Fujitsu per risolvere alcuni problemi tipici del mondo HPC.

Uno dei principali ostacoli nella progettazione di sistemi HPC sta nel contenere al minimo lo spostamento dei dati: il limite principale all'incremento nella potenza di calcolo sta infatti nella velocità di spostamento dei dati tra processori e memoria e tra dischi e memoria. Per risolvere questo problema Fujitsu è ricorsa all'uso di memoria HBM2 installata direttamente sui processori: non è dunque presente la classica RAM installata nei socket DIMM, ma sono invece installati 32 GB di memoria HBM2 in ciascun processore.

Sebbene tale quantitativo possa apparire esiguo, l'elemento che fa la differenza è quello della banda passante: la memoria HBM2 permette di arrivare a 1 terabyte al secondo, mentre l'interconnessione ToFu, sviluppata da Fujitsu, collega sia i core che i processori con una banda di 400 Gbps.

Il processore può essere utilizzato come una CPU "tradizionale", ma può anche essere impiegato per effettuare calcoli per cui normalmente si utilizzano delle GPU grazie a delle estensioni vettoriali dell'architettura ARMv8 sviluppate in collaborazione con ARM. Fujitsu ha poi inserito istruzioni specifiche per carichi di lavoro IA che permettono all'A64FX di ottenere prestazioni elevate con consumi ridotti.

Grazie a queste caratteristiche Fugaku raccoglie l'eredità di K ed è già ora il supercomputer più efficiente al mondo, nonostante sia ancora in fase prototipale.

Oltre al Fugaku, il Fujitsu A64K vivrà poi anche in altri supercomputer: l'azienda ha infatti stretto un accordo con Cray, ora di proprietà di HPE, per creare soluzioni HPC dotate del processori. I server Cray CS500 saranno disponibili entro la metà del 2020 e supporteranno l'ambiente di sviluppo Cray già utilizzato per le macchine basate su processori x86, minimizzando dunque l'impatto della nuova architettura sullo sviluppo del software.

Il piano di Fujitsu e del RIKEN Institute prevede inoltre di fornire la tecnologia utilizzata per il supercomputer Fugaku anche come infrastructure as a service, nonché come nodi da vendere ai vari fornitori di servizi cloud. Ulteriori informazioni sul processore e sui piani di Fujitsu sono disponibili a questo indirizzo.

ARM sembra quindi destinata a ritagliarsi uno spazio di rilievo all'interno del mondo HPC e del mondo server, con le evoluzioni del settore che tratteggiano un quadro in cui i processori ARM competeranno sempre più strettamente con quelli x86. Non è detto che questi ultimi non riutilizzino poi alcune delle innovazioni proposte da ARM nelle proprie architetture: la guerra tra RISC e CISC è ben lontana dalla fine, ma si preannuncia interessante.

I migliori sconti su Amazon oggi

-23%

Microsoft 365 Family | 12 mesi | 6 persone | App Office con AI | Fino a 6TB di Spazio di archiviazione OneDrive | Codice d'attivazione via email

129.00 99.00€ Compra ora

-3%

HP Victus 16-r1000sl Notebook, Intel Core i7-14700HX, RAM 16GB DDR5 5600Mhz, 1TB SSD, Display 16.1" FHD IPS 165Hz, RTX 4070 da 8GB, 3 Mesi di PC Game Pass Incluso, Windows 11, Grigio

1399.99 1364.05€ Compra ora

-3%

HP 250 G10 notebook portatile, Ram 64Gb, SSD da 2Tb display IPS FHD 15.6", Cpu Intel i7 1355U 10Core 5GHz, Wi-fi, 3 usb, Bt, Usb to Lan, Cybersaver, Win 11 Pro, pronto all'uso, Garanzia Italia 3 anni

1099.00€ Compra ora

Samsung, la produzione a 3 nanometri slitta a causa del Coronavirus?

Intel Core H di decima generazione: andiamo oltre le frequenze di clock strabilianti

supertigrotto07 Aprile 2020, 11:40 #1

Ma la guerra fra cisc e risc è già finita da un bel po',nessuna delle due architetture è ancora pura.
Ambedue le architetture hanno sconfinato nell'ambito dell'altra.
Complex e Reduced nei tempi moderni non hanno ormai nessun significato concreto,le differenze si sono assottigliate con l'aumento della complessità nei numeri dei transistor e nelle istruzioni.

LMCH09 Aprile 2020, 13:22 #2

Originariamente inviato da: supertigrotto

Non è proprio così, il tuo ragionamento funziona solo se si considerano gli x86 che col tempo sono diventati processori superscalari out-of-order risc-like con un decoder delle istruzioni cisc che le spezzetta in operazioni risc-like.

Se invece si guarda a come si stanno evolvendo le architetture hardware, si nota che le cose sono molto più complesse di un semplice "cisc contro risc".
Ad esempio, adesso c'è molto interesse per le architetture EDGE (Explicit Data Graph Execution) ed inoltre c'è pure un evoluzione a livello di implementazione verso layout che puntano ad "accorciare i fili". Con l'aumentare della scala d'integrazione il limite non è più la velocità di switching dei transistor, ma l'aumento della resistenza nei collegamenti (diventando più ridotti in sezione, aumenta la resistenza per unità di lunghezza, che contribuisce a limitare la frequenza massima raggiungibile).
Ed è da questi elementi che ad esempio si giunge a realizzare cpu come la Prodigy di Tachyum che mira a rimpiazzare sia le cpu "tradizionali" che le GPU nei cloud e nei supercomputer.

cdimauro09 Maggio 2020, 21:42 #3

Originariamente inviato da: supertigrotto

E invece non è affatto così.

Sono i RISC che ormai praticamente non esistono più come design, perché... sono diventati dei CISC. Basti vedere i "pilastri" su cui si fondavano i RISC e i CISC, e confrontarli coi processori attuali: vedresti che i CISC hanno mantenuto le loro caratteristiche, ma i RISC no (hanno preso a piene mani dai CISC).

Questo nonostante accademici e non continuano a spacciare che non esistano più design CISC, e che quindi abbiano vinto i RISC. Queste sono pure balle marchettare, che purtroppo continuano a essere propinate ancora oggi.

Originariamente inviato da: LMCH

Questo è che avviene internamente, e tra l'altro succede persino con alcuni RISC (che spezzettano istruzioni complessi in altre più semplici).

Ma vedi sopra: i pilastri (differenze fra le macrofamiglie) di RISC e CISC vengono rispettati soltanto da questi ultimi.

Se invece si guarda a come si stanno evolvendo le architetture hardware, si nota che le cose sono molto più complesse di un semplice "cisc contro risc".
Ad esempio, adesso c'è molto interesse per le architetture EDGE (Explicit Data Graph Execution) ed inoltre c'è pure un evoluzione a livello di implementazione verso layout che puntano ad "accorciare i fili". Con l'aumentare della scala d'integrazione il limite non è più la velocità di switching dei transistor, ma l'aumento della resistenza nei collegamenti (diventando più ridotti in sezione, aumenta la resistenza per unità di lunghezza, che contribuisce a limitare la frequenza massima raggiungibile).
Ed è da questi elementi che ad esempio si giunge a realizzare cpu come la Prodigy di Tachyum che mira a rimpiazzare sia le cpu "tradizionali" che le GPU nei cloud e nei supercomputer.

Ma non in tutti gli ambiti; tutt'altro.

Si tratta di architetture specializzate, che richiamano anche i VLIM. Non sono generali, e quindi non rimpiazzeranno mai i processori tradizionali. Troveranno, al solito, la loro nicchia in cui prospereranno.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

VIDEO IN EVIDENZA

TOPICS

tutti gli articoli »

tutte le news »

Gigabyte Aero X16 Copilot+ PC: tanta potenza non solo per l'IA Un notebook che punta sull'abbinamento tra potenza di calcolo, schermo ampio e dimensioni nel complesso compatte. Gigabyte Aero X16 Copilot+ PC si trasporta facilmente,...

Recensione REDMAGIC Astra Gaming Tablet: che spettacolo di tablet! Il REDMAGIC Astra Gaming Tablet rappresenta una rivoluzione nel gaming portatile, combinando un display OLED da 9,06 pollici a 165Hz con il potente Snapdragon 8...

Dopo un mese, e 50 foto, cosa abbiamo capito della nuova Nintendo Switch 2 Dopo un mese di utilizzo intensivo e l'analisi di oltre 50 scatti, l'articolo offre una panoramica approfondita di Nintendo Switch 2. Vengono esaminate le caratteristiche...

Fujifilm X-E5: la Fuji X che tutti gli appassionati volevano Dopo il fascino un po’ elitario della GFX100RF e le polemiche intorno a x Half, la nuova Fujifilm X-E5 riporta tutti d’accordo: una mirrorless compatta, leggera,...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HPE Discover 2025: tra agenti intelligenti, infrastruttura AI-native e un futuro ibrido Edge9 ha seguito da vicino HPE Discover 2025 con accesso esclusivo a keynote e interviste. Dalla Sphere di Las Vegas, la visione di un’infrastruttura AI-native e...

Nuova Ford Capri elettrica, la super prova: in viaggio, in città e in autostrada Dopo diverse prove, da poche ore al volante, fino a un'intera settimana come prima auto, possiamo riportarvi tutti i dettagli e le impressioni sulla Ford Capri elettrica...

Roborock Saros Z70: un braccio meccanico per fare ordine in casa Dotato di tutte le ultime innovazioni in tema di aspirazione della polvere e pulizia dei pavimenti di casa, Roborock Saros Z70 integra un braccio meccanico che promette...

Fujitsu A64FX: ARM arriva nei supercomputer con prestazioni di alto livello

Fujitsu A64FX: i processori ARM arrivano nei supercomputer

Microsoft 365 Family | 12 mesi | 6 persone | App Office con AI | Fino a 6TB di Spazio di archiviazione OneDrive | Codice d'attivazione via email

HP Victus 16-r1000sl Notebook, Intel Core i7-14700HX, RAM 16GB DDR5 5600Mhz, 1TB SSD, Display 16.1" FHD IPS 165Hz, RTX 4070 da 8GB, 3 Mesi di PC Game Pass Incluso, Windows 11, Grigio

HP 250 G10 notebook portatile, Ram 64Gb, SSD da 2Tb display IPS FHD 15.6", Cpu Intel i7 1355U 10Core 5GHz, Wi-fi, 3 usb, Bt, Usb to Lan, Cybersaver, Win 11 Pro, pronto all'uso, Garanzia Italia 3 anni

3 Commenti