Le soluzioni HPC Lenovo: non solo on-premise

Le soluzioni HPC Lenovo: non solo on-premise

Lenovo e uno dei leader del settore HPC, quello dei supercomputer dedicati alla ricerca scientifica, mineraria e all'analisi finanziaria. Le sue soluzioni sono alla base di alcun dei cluster di elaboratori più potenti al mondo e questa potenza di calcolo è oggi disponibile a chiunque, anche solo per poche ore. Alla classica formula on-premise Lenovo ha affiancato anche i modelli HaaS e cloud

di pubblicato il nel canale Cloud
LenovoHPC
 

Lenovo è fra i leader del complesso settore delle soluzioni HPC, dedicate all'High Performance Computing. Non si tratta di “semplici” computer ultrapompati, ma di enormi cluster composti da migliaia di processori (in alcuni casi vengono sommate delle GPU, dipende dalle applicazioni per cui sono concepiti) che occupano grandi stanzoni e che lavorano in parallelo per fornire una potenza di calcolo altrimenti inimmaginabile. I più famosi, e potenti, sono quelli elencati nella Top 500, una lista aggiornata due volte all'anno che elenca i 500 supercomputer più potenti al mondo e vede Lenovo prima per numero di sistemi in classifica. Per valutare le performance di questi particolarissimi elaboratori si guarda a un solo parametro, i TeraFlops, dove un FLOPS (FLoating Operations Per Second) equivale al numero di operazioni in virgola mobile al secondo. Un computer da un Teraflops è in grado di svolgere 1.000 miliardi di operazioni al secondo.

marenostrum

Cosa sono gli HPC?

I sistemi per l’High Performance Computing non si comprano a scatola chiusa, come possiamo fare per esempio con un server. Si tratta di sistemi estremamente specializzati, concepiti per velocizzare calcoli specifici, e non esiste un listino, ma sono realizzati su richiesta del cliente, sia esso un governo, un’università o un’azienda privata. Molto spesso, le componenti di base sono quelle standard, come i processori Intel Xeon o le GPU Tesla V100 di NVIDIA, ma questi elaboratori sono tutto fuorché standard. Qualsiasi appassionato è in grado di assemblarsi un server con più CPU o GPU in casa, ma quando si parla di migliaia e migliaia di nodi, la sfida diventa ben più complessa ed è richiesta una delicata fase di progettazione per far sì che questi sistemi risultino efficienti, privi di colli di bottiglia. Ecco quindi la necessità di sistemi di comunicazione particolarmente veloci, come le schede di rete Infiniband, concepita proprio per le applicazioni di exascale computing (1 Exaflops equivale a 1.000.000 di Teraflops) capaci di trasferire dati a 100 Gigabit al secondo.
Come si può facilmente immaginare, enormi cluster che ospitano migliaia di processori tendono a consumare molta energia e a generare una quantità elevatissima di calore, che deve essere smaltito per evitare di far surriscaldare le componenti.

Ecco perché in fase di progettazione gli ingegneri devono studiare soluzioni particolari per garantire il giusto raffreddamento ai macchinari e allo stesso tempo ridurre quanto più possibile i consumi energetici, che rappresentano un costo di gestione non indifferente. La classica aria condizionata rischierebbe di far salire i costi a livelli inaccettabili, oltre ad avere un impatto ambientale importante.

Quali sono gli ambiti applicativi degli HPC?

Ma a chi servono elaboratori tanto potenti? I principali acquirenti sono governi, enti militari, università e anche aziende private, che li usano per calcoli estremamente complessi. Ad esempio, per simulare i danni che potrebbe causare un terremoto in una specifica zona. Un altro scenario è quello della simulazione di sistemi complessi per la generazione di energia con basso impatto ambientale, delle simulazioni per la gestione delle infrastrutture critiche, oppure degli studi biotecnologici e di chimica computazionale, di fluidodinamica applicata al settore della combustione e allo sviluppo di codici per la fusione nucleare.  In Italia Cineca utilizza il suo supercomputer Marconi, realizzato proprio da Lenovo e posizionato al 19 posto della Top 500, per le attività di ricerca scientifica e analisi di big data. Le banche si affidano a queste macchine per effettuare operazioni di HFT (High Frequency Trading), che potremmo definire come bot che analizzano le minime variazioni sul mercato azionario e fanno operazioni di compravendita di stock. Le case farmaceutiche le usano per fare ricerca su nuovi farmaci, mentre i colossi dell’energia usano simulazioni per andare alla ricerca di zone dove effettuare trivellazioni esplorative alla ricerca di nuovi giacimenti. Gli scenari sono, insomma, teoricamente infiniti: fluidodinamica, biotecnologie, simulazioni.

Marconi_elab

Quali sono i punti di forza delle soluzioni Lenovo per HPC?

Lenovo è fra i principali attori del settore HPC, tanto che con 173 sistemi installati è il primo fornitore di supercomputer al mondo della Top 500. Merito anche delle soluzioni innovative che applica a questo settore, a partire dalla tecnologia di raffreddamento a liquido Neptune, impiegata ad esempio nel supercomputer SuperMUC-NG installato al centro LRZ di Lipsia, che grazie a questo sistema è considerato uno dei supercomputer più efficienti al mondo, in termini energetici. Un “mostro” capace di 26,7 petaflops/s che si posiziona al 9° posto della Top 500.

Neptune si basa su tre differenti tecnologie che possono essere utilizzate singolarmente o tutte insieme, a seconda delle specifiche esigenze.

Direct to Node (DTN) Warm Water Cooling è un un sistema di heatpipe che va a coprire direttamente le componenti (CPU, GPU, memoria, regolatori di tensione, dispositivi di archiviazione dati), evitando l’uso delle ventole, rumorose e meno efficienti rispetto al liquido. Questo ha permesso agli ingegneri di Lenovo di spingere le CPU Xeon Scalable sino a 240 Watt, mentre coi sistemi raffreddati ad aria non era possibile andare oltre i 165 W. Da sola, questa soluzione consente di ridurre i consumi energetici fino al 30-40%, pur con prestazioni superiori, a parità di hardware.

DirecttoNodeDataCooling

Al DTN, che raffredda i singoli nodi, Lenovo affianca l’RDHX, Rear Door Heat Exchanger, che si occupa di raffreddare gli armadi rack. Anche in questo caso viene sfruttato del liquido che scorre attraverso uno degli sportelli e che si occupa di smaltire la temperatura dell’aria che circola all'interno del rack. È facilmente installabile anche su classici armadi da server e, grazie a un’efficienza superiore all'80% nello smaltimento di calore, contribuisce ad abbassare i costi legati al raffreddamento dell’infrastruttura.

Un ultimo accorgimento per tenere sotto controllo le temperature l’adozione dei moduli TTM (Thermal Transfer Module), dei condotti termici realizzati specificamente per questo tipo di applicazioni, contenenti un liquido che accelera lo smaltimento del calore riducendo allo stesso tempo il ronzio generato dalle ventole.

Thermal Transfer Module

Dallara e Lenovo, una stretta collaborazione

Dallara è un’azienda automobilistica che punta molto sulla tecnologia per realizzare le sue auto, vetture ben fuori dal comune. Fatta eccezione per la recente Dallara Stradale, l’azienda emiliana concentra la sua produzione su vetture da competizione: Formula Indy, Formula E, senza tralasciare le Formula 1 (la Haas è realizzata proprio da Dallara). L’azienda può vantare uno dei simulatori di guida professionali più evoluti al mondo e supporta anche altri produttori, come Bugatti, che si è rivolta proprio alla Casa di Varano de’ Melegari (PR) per avere supporto nello sviluppo della Chiron, una hypercar che costa poco meno di 3 milioni di euro.

Per capire quanto sia importante la tecnologia in Dallara, basti pensare che l’azienda nel 2004 ha voluto alla sua guida Andrea Pontremoli, ai tempi Amministratore Delegato di IBM Italia, uno che la tecnologia la conosce a fondo e che ha supervisionato la recente installazione di un nuovo HPC fornito da Lenovo.

Lenovo-HPE

Si tratta di un cluster NeXtScale basato su una serie di nodi Lenovo nx360 M5 per l’elaborazione dei dati, affiancati da un server Lenovo System x3650 M5 al quale è delegata la gestione dello storage software-defined.

Il supercomputer di Dallara realizzato da Lenovo: campi di applicazione

Il cluster che Lenovo ha installato presso la sede di Dallara si occupa di effettuare simulazioni CFD (Computational Fluid Dynamics) e FEA (Finite Element Method), fondamentali per simulare il comportamento di un’automobile e la sua resistenza agli impatti prima ancora di realizzare dei modelli fisici. Grazie a queste simulazioni, l’azienda è in grado di “testare” l’auto ancora prima di produrla, velocizzando lo sviluppo e riducendo notevolmente il numero di prototipi necessari per la messa in produzione: è proprio grazie a queste simulazioni che Bugatti ha potuto risparmiare cifre significative sui crash test nello sviluppo delle sue hypercar.

Dallara+CFD

“Oggi possiamo effettuare modellazioni CFD in sole due ore e mezza – ha dichiarato Fabrizio Arbucci, CIO di Dallara – “In precedenza occorrevano cinque ore, quindi si tratta di un miglioramento enorme. Quest’anno siamo stati in grado di eseguire una particolare simulazione della scia del veicolo, con 1,25 miliardi di celle, in sole 12 ore. Possiamo inoltre effettuare diverse simulazioni in contemporanea e in questo modo i diversi team e divisioni non devono attendere il proprio turno per effettuare le proprie analisi”.

A questo supercomputer Lenovo ha poi affiancato 10 server ThinkSystem SR650 per la gestione dell’ambiente VDI, Virtual Desktop Infrastructure.

Al di là della potenza di calcolo, è molto interessante la soluzione di raffreddamento adottata, che limita al minimo l’uso di aria condizionata, permettendo di risparmiare una buona parte dell’energia altrimenti richiesta per il raffreddamento.

"Lenovo si è distinta fra tutti i vendor per prestazioni, disponibilità, affidabilità, efficienza e costi della soluzione che ci hanno prospettato" – spiega Arbucci - "Siamo rimasti bene impressionati anche dalla loro offerta di Lab Service, per mezzo della quale hanno progettato una soluzione HCP ideale per tutte le nostre esigenze. Ad oggi possiamo fare più simulazioni CFD e analisi a elementi finiti più rapidamente e abbiamo significativamente migliorato la flessibilità, la sicurezza e l’efficienza delle postazioni. La tecnologia Lenovo dà la spinta agli strumenti di cui abbiamo bisogno per perseguire la nostra ricerca della perfezione".

Le soluzioni HPC di Lenovo

Come abbiamo spiegato in precedenza, assemblare un HPC non è una questione semplice. Non basta acquistare CPU, RAM e schede madri e mettere insieme il tutto, soprattutto se si ha l’esigenza di scalare l’architettura col tempo. I sistemi di Lenovo sono studiati per semplificare l’installazione, e sono estremamente affidabili, tanto da essere impiegati in numerosi data center in diverse aree del pianeta. Sono sistemi adatti a differenti scenari di utilizzo, e sono già impiegati per applicazioni finanziarie, nella ricerca scientifica, e anche da aziende che lavorano nel settore delle energie, per esempio dell’estrazione di gas e petrolio.

Per garantire il massimo delle performance, questi sistemi supportano i protocolli InfiniBand e Omni-Path, che permettono di trasferire dati fra i vari cluster a velocità estremamente elevate, sino a un massimo di 100 Gbit/s.

Al di là della potenza di calcolo, però, è l’esperienza di Lenovo in questo settore il vero valore aggiunto. Parliamo di un’azienda che ha curato l’installazione di praticamente un computer su 4 fra quelli della TOP 500, e non è un caso se 17 dei 25 istituti di ricerca hanno affidato alla multinazionale di origine cinese la realizzazione dei loro HPC.

Fra le varie soluzioni Lenovo, i ThinkSystem SR670 Rack Server sono quelli più adatti per le applicazioni di intelligenza artificiale, quindi per calcoli relativi a machine learning, deep learning, e inferenza. Sono basati su GPU e ogni modulo ne può alloggiare sino a 8 all'interno di un rack 2U. Come processori sono usati degli Xeon Scalable con un TDP massimo di 205 Watt per singolo nodo, che può supportare sino a 768 GB di RAM TruDDR4.

lenovo-data-center-servers-rack-thinksystem-sr670

Anche i ThinkSystem SD530 sono in formato rack 2U ma possono montare un massimo di due GPU per nodo. La minore potenza di elaborazione su GPU è controbilanciata dal maggior quantitativo di RAM installabile (sino a 2 TB). Questi sistemi supportano le memorie persistenti Intel Optane DC, che consentono di riavviare la macchina in pochi secondi, di aumentare la densità di macchine virtuali, e di diminuire le latenze dei processi fino a 14 volte.

lenovo-server-high-density-thinksystem-sd530

Nell'attuale offerta di Lenovo, il server adatto ai compiti più gravosi dal punto di vista computazionale è ThinkSystem SD650, che sfrutta le più evolute tecnologie di raffreddamento a liquidi per disperdere il calore e permette di concentrare in poco spazio una potenza di calcolo impressionante: il case NeXtScale n1200, in formato rack 6U, contiene ben 12 SD650. Questo significa poter comprimere in uno spazio limitato 24 CPU, 9,2 TB di RAM e 12 drive NVMe o 24 dischi SFF SSD.

lenovo-server-high-density-thinksystem-sd650

Lenovo HPC anche as a Service e in cloud

Considerata la tecnologia che pulsa all'interno di un HPC è evidente che il prezzo di acquisto non può essere contenuto. Lenovo però mette a disposizione numerose formule per poter avere accesso a tutta questa potenza di calcolo e l’acquisto è solo una delle vie percorribili, quella più tradizionale. 
Le aziende che preferiscono spostare le spese da CapEx a OpEx possono contare su due ulteriori modelli: HPC HaaS (HPC Hardware as a Service) e HPC Cloud.

Il modello HaaS è attualmente uno dei più apprezzati dalle organizzazioni, dal momento che permette di delegare la complessa gestione del sistema a Lenovo, che si occuperà dell’installazione, della manutenzione e – se necessario – di aggiornare il sistema man mano che aumenta la richiesta di potenza di calcolo. L’approccio HaaS è estremamente versatile, dato che i clienti potranno scegliere la soluzione più adatta alle loro esigenze del momento, espandendola molto velocemente quando si rende necessaria più potenza di calcolo, con la certezza di non dover mai pagare per l’hardware che si ha in casa, ma solo per le risorse che realmente vengono utilizzate. La gestione di questi sistemi non è particolarmente complessa o, meglio, la complessità non sarà un problema per l’azienda, dal momento che Lenovo si occuperà di installare, configurare l’HPC, mettendo a disposizione un Customer Success Manager dedicato.

Una formula ancora più accessibile è la soluzione HPC Cloud, che non prevede l’installazione di hardware poiché tutta la potenza di calcolo viene resa disponibile via cloud quando richiesto. Anche questo è un modello a consumo, nel quale si pagano solo le risorse realmente utilizzate di volta in volta, ed è estremamente facile da scalare: non è necessario installare nulla on-premise e di conseguenza bastano pochi click per aumentare la potenza di calcolo nel momento del bisogno. La soluzione HPC Cloud torna utile anche per potenziare momentaneamente le risorse on-premise, andando ad aggiungere ulteriore potenza di calcolo in maniera immediata, senza dover aggiungere rack o riconfigurare il sistema.

 

 

2 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
guidobonin22 Febbraio 2020, 08:03 #1
Impressionante
boboviz22 Febbraio 2020, 11:05 #2
Ho visitato (periodicamente lo aprono al pubblico) il CSCS di Lugano.
Veramente incredibile quello che riescono a fare.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^