Uno sguardo ai data center dell'Università di Pisa, tra i dischi NVMe di Dell Technologies e il coronavirus

Uno sguardo ai data center dell'Università di Pisa, tra i dischi NVMe di Dell Technologies e il coronavirus

Abbiamo intervistato il CTO dell'Università di Pisa, Maurizio Davini, e abbiamo parlato di come i dischi NVMe stiano rivoluzionando i data center, della collaborazione tra l'ateneo pisano e Dell e di come sia possibile affrontare la pandemia in corso

di , Riccardo Robecchi pubblicata il , alle 17:21 nel canale Innovazione
Dell TechnologiesEMC
 

L'Università di Pisa ha annunciato il rinnovo dell'infrastruttura di storage all'interno dei suoi data center avvenuto con la collaborazione di Dell Technologies, grazie alla quale l'ateneo toscano ha ora a propria disposizione array di unità NVMe di ultima generazione con cui supportare le proprie attività didattiche e di ricerca. Questo rinnovo arriva in un momento cruciale, in cui è necessaria ancora di più la facilità di gestione dei sistemi anche da remoto e in cui le attività dell'Università dipendono interamente dalle infrastrutture tecnologiche. Abbiamo parlato delle sfide che devono essere affrontate con Maurizio Davini, CTO dell'ateneo pisano.

Come le nuove tecnologie (e la pandemia) cambiano l'IT dell'Università di Pisa

Edge9: Negli ultimi dieci anni abbiamo assistito a una crescente centralizzazione della potenza di calcolo e dell'archiviazione nel cloud. A Microsoft Ignite, il CEO Satya Nadella ha affermato che è ora che tali capacità tornino a essere maggiormente distribuite. È ancora, o di nuovo, l'epoca dei data center decentralizzati o il cloud centralizzato rappresenta una risorsa fondamentale e insostituibile?

Maurizio Davini, Università di Pisa

Davini: "Questa posizione da parte dei grandi cloud provider era attesa. Io mi definisco un uomo da data center e non sono un grande fan del cloud, pur apprezzando il fatto che questa tecnologia abbia portato benefici dovunque, soprattutto lato software e dal punto di vista della capacità di gestione dei data center. L'effetto positivo della ricaduta del cloud è visibile ovunque e il fatto che Satya Nadella abbia parlato di spostamento delle tecnologie del cloud fuori dai data center del cloud era sperato e atteso.

"Ormai la parte interessante della tecnologia si muove verso l'edge, verso la capacità di fare analisi vicino ai dati. Era chiaro fin dall'inizio che, a un certo punto, la rete ce l'avrebbe fatta sempre meno, per cui il modello doveva per forza ritornare a essere distribuito e non centralizzato. Pur non essendo un fan dello spostare l'intera infrastruttura in cloud, vedo i benefici che tutti noi abbiamo avuto nella possibilità che il modello cloud ha offerto nello sviluppo di modelli ibridi, che raggiungono la loro completezza con il modello edge. Abbiamo già ora dei modelli ibridi, metà nei nostri data center e metà nel cloud, e ci stiamo muovendo anche nella rete universitaria verso un modello edge in certe strutture particolari. È un modello dunque che diventa pervasivo anche per infrastrutture come la nostra."

Edge9: Qual è il ruolo delle Università nello sviluppo di questi modelli di utilizzo della tecnologia? In questo contesto siete solo degli "utenti" di cloud e data center o le Università hanno un ruolo attivo nella definizione dei modelli d'uso della tecnologia?

Davini: "Come direzione delle infrastrutture dell'Università di Pisa, che è quella che si occupa della rete, dei data center e del calcolo scientifico, non abbiamo mai smesso di fare ricerca. La ricerca è alla base di tutto quello che facciamo e raramente si vedono impiegate all'Università di Pisa soluzioni standard, se non per quella parte di servizi 'enterprise' che l'Università offre a se stessa: servizi amministrativi, servizi per la didattica e così via. In questo caso ci muoviamo su ambienti ibridi, ad esempio con VMware Horizon, che si 'ibridizzano' per tutto quello che riguarda la parte di collaborazione.

"Ci possiamo raccontare quello che vogliamo, ma senza Microsoft Teams of Google Meet la didattica a distanza in una settimana non si sarebbe messa in piedi. Prendere 50.000 studenti come nel nostro caso, e portarli da essere in presenza a essere a distanza in una settimana, se non ci fosse stato il cloud non l'avremmo mai fatto. Questi sono gli strumenti che, mescolati opportunamente con i servizi on premise, danno una soluzione vincente. Da soli non ce l'avremmo mai fatta e vediamo dunque i benefici del cloud in questo senso.

"Per quello che riguarda, invece, la parte di rete, l'Università di Pisa è simile a Cambridge ed è un campus universitario distribuito per la città: abbiamo 9000 km di fibra ottica che collega i dipartimenti, per cui abbiamo una specie di tavola bianca su cui possiamo disegnare la rete come ci pare e con la quale possiamo offrire vari servizi. Riguardo la parte di calcolo scientifico, cerchiamo invece di muoverci, compatibilmente con il fatto che siamo un'Università pubblica [e quindi con fondi sempre troppo limitati, NdR], al limite della tecnologia: qui si trovano tutte le ultime novità, per quanto possibile in un mercato pubblico come quello delle università e comunque in Italia. L'accesso alle ultime tecnologie in Italia non è infatti sempre banalissimo. Cerchiamo dunque di mescolare le ultime tecnologie con le infrastrutture tradizionali. Ed è una bella sfida con 50.000 utenti.

"Negli ultimi 5 anni abbiamo organizzato un servizio di calcolo centralizzato e ora siamo in una posizione interessante: cerchiamo di essere competitivi e per farlo bisogna avere le ultime tecnologie. Nel calcolo scientifico la parte di IA ha cambiato tutto: siamo passati da un ambiente tradizionale, ad esempio di simulazione ingegneristica o chimica, a qualcosa di completamente nuovo che porta a ridisegnare le infrastrutture, lo storage, le reti perché è tutto ragionevolmente cambiato. Se si vuole essere competitivi anche per i ragazzi (ché poi si fa tutto questo per loro!), questo è secondo noi il modo migliore per farlo."

Edge9: L'avvento degli SSD ha portato a un netto cambiamento nelle prestazioni per i computer personali. Quali sono le differenze maggiori per i data center come quelli dell'Università di Pisa?

Davini: "I cambiamenti introdotti da queste tecnologie sono colossali. Più che gli SSD in senso stretto, quello che ha cambiato la situazione sono i dischi NVMe e, dopo di quelli, le memorie Optane di Intel. Per la prima volta, dopo quarant'anni, i docenti di programmazione spiegano ai ragazzi che il disco si può toccare e che ha un'efficienza quasi uguale a quella della RAM. Abbiamo educato generazioni di programmatori a non toccare il disco perché era lento, oggi è esattamente l'opposto e bisogna toccarlo perché va come la RAM. Questo ha un impatto micidiale. In questo momento è limitato dai prezzi, ma è impressionante.


"Noi abbiamo questi dischi in varie soluzioni di storage, da quella tradizionale di VMware fornita dai PowerStore di Dell Technologies, ad array fatti con prodotti di startup come Excelero che fa NVMe over Fabrics, ovvero una rete InfiniBand a 200 Gbit con macchine collegate da cui porti il bus NVMe sulla rete, su cui si scrive a velocità di 40-50 GB/s. Quello che sta guidando il mercato di queste tecnologie è l'intelligenza artificiale, perché lo storage dell'IA è completamente diverso rispetto a quello HPC tradizionale e richiede caratteristiche di I/O diverse, dato che ha moltissimi file più piccoli rispetto ai carichi tradizionali, come un file di mesh di una macchina di Formula 1 che si carica per fare i calcoli sull'aerodinamica. Anche le performance di un database come Oracle sono aumentate di 10 o 15 volte. Il problema fondamentale è il costo, ma la produttività di chi lavora sui sistemi che ne fanno uso è aumentata di un fattore 4 o 5 e non abbiamo avuto problemi a gestire da remoto queste operazioni. Da un punto di vista economico è un impegno importante, ma poi da un punto di vista di ritorno dell'investimento la differenza si vede."

Edge9: Quali sono i dati e le applicazioni che i data center dell'Università devono trattare e quali sono le sfide a essi collegati?

Davini: "La sfida per noi è integrare tutte le fonti dei dati, che per noi sono i laboratori che vanno dagli spettrometri di massa alle macchine per la genomica, in un sistema di analisi e offrire a questo sistema distribuito il migliore storage e la migliore rete. Abbiamo dati di tutti i tipi: ad esempio, stiamo usando il Dell EMC PowerStore per la ricerca sul genoma del COVID e sul grafene. E ormai l'uso degli algoritmi di intelligenza artificiale è ovunque, quindi si trovano nelle applicazioni di chimica, di medicina, di farmacia, di ingegneria. Questi sono i dati di punta che teniamo in questo storage di ultima generazione.

"Anche per applicazioni come il NAS tradizionale, usando gli SSD [non NVME, NdR] le performance sono di un altro livello. Ovviamente la rete dev'essere all'altezza: la velocità minima da noi è di 25 Gbit/s dentro il data center, con la rete backbone che arriva a 200 Gbit/s e quella che arriva agli strumenti che è di 10 Gbit/s, dove non è possibile fare di meglio. Dove c'è il dato ci vuole la rete e con la velocità Gigabit si fa poco: serve comunque un ordine di grandezza di 100/200 Gbps, per usare questi oggetti. Oggi lo storage è indubbiamente la parte più interessante."

Edge9: In un'intervista al responsabile HPC dell'Università di Cambridge era emerso che l'HPC sia in realtà molto più economico oggi rispetto a quanto fosse vent'anni fa. Qual è la sua visione in merito?

Davini: "È vero! Da quando l'HPC è passato dai supercomputer all'uso di architetture tradizionali è totalmente vero, perché non ci sono più le soluzioni proprietarie. Dipende comunque molto dalle dimensioni: sulle macchine exascale ci sarà comunque bisogno di architetture particolari, ma rimanendo sul mantra degli ultimi anni, ovvero portare l'HPC a tutti, oggi si tratta di un oggetto che per l'uso comunque è infinitamente più economico di prima. Basta sapere come mettere insieme i pezzi corretti per fare il calcolo.

"L'HPC tradizionale, ovvero un cluster di simulazioni su macchine parallele, è veramente quasi diventato economico se si pensa alla potenza di una GPU di oggi paragonata al suo costo. Basta pensare che una macchina come una NVIDIA DGX-A100 da 200.000€ ha la potenza di un [supercomputer] Cray da 15 milioni di 10 anni fa. Questo dà veramente un'idea di quanto oggi costi infinitamente meno. Il problema era anche dove mettere le macchine, ma oggi queste macchine si ospitano tranquillamente in un data center universitario come il nostro. Avremo il problema nel prossimo futuro, specialmente se il trend per le CPU sarà quello dell'aumento del consumo, di pensare a utilizzare il raffreddamento a liquido e ciò non sarà gratis a livello di infrastruttura.

"C'è poi il fatto che Microsoft, e poi anche AWS e Google, ha cominciato a mettere a disposizione infrastrutture HPC di ultimissima generazione, quindi chi ha bisogno di utilizzare queste architetture le trova nel cloud. Non è economico, ma avendo necessità si trova l'ultimissima generazione di hardware che si può usare on demand, molto prima di quando possiamo averla noi e senza tutti i costi associati. Resta comunque il problema della rete nel mezzo, ma non sarà facilmente risolubile."

Edge9: - Quali sfide ha dovuto affrontare l'Università nel cambiamento imposto dalla pandemia? Quale impatto hanno subito i sistemi nel dover supportare (e sopportare) la didattica e la ricerca a distanza?

Davini: "Siamo sempre stati collegati molto bene e questo ci ha aiutato molto. Per la didattica da remoto ci siamo affidati al cloud e abbiamo usato Microsoft Teams e Google Meet. Quello però di cui ci siamo resi conto è che dobbiamo migliorare nell'automazione dei servizi: facciamo ancora troppo a mano e ciò non è compatibile con queste situazioni. Dobbiamo essere sempre più capaci di automatizzare il supporto alle applicazioni e su questo non eravamo preparati. È una cosa che abbiamo imparato e cerchiamo di migliorarci. Senza il cloud non ce l'avremmo mai fatta."

0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^