L'impatto dell'IA sullo storage: il punto di vista di Pure Storage

L'impatto dell'IA sullo storage: il punto di vista di Pure Storage

L'IA trainerà la domanda per soluzioni di storage più efficienti e sostenibili dal punto di vista ambientale. I classici dischi fissi sono troppo energivori ed è necessario valutare opzioni basate su flash per ridurre i costi e le emissioni di CO2

di pubblicata il , alle 18:11 nel canale data
Pure StorageData ManagementSostenibilità
 

L'intelligenza artificiale è la tecnologia che ha preso piede più rapidamente di tutte e oggi c'è un fermento incredibile sul tema. Numerosissime le aziende che l'hanno già adottata o stanno facendo piani per integrarla in azienda. E sono tantissimi anche i semplici utenti domestici, che utilizzano servizi come ChatGPT o Bing Chat. C'è anche un rovescio della medaglia, però: mettere in piedi sistemi per l'IA richiede un notevole dispendio di risorse, sia per l'elaborazione dei dati, sia per lo storage. Avevamo affrontato il tema dal punto di vista dei sistemi di raffreddamento per data center, che dovranno a breve venire aggiornati per tenere a bada le temperature di processori che usano sempre più energia. Ora affrontiamo il tema dal punto di vista delle esigenze di storage. 

I nuovi LLM richiedono set di dati sempre più grandi

Umberto Galtarossa_Partner Technical Manager_Pure Storage

L'IA, ci teniamo a ribadirlo, non è una tecnologia nuovissima. Quello che sta avendo un impatto enorme è uno specifico ambito di applicazione, quello dell'IA generativa. "Negli ultimi anni l’IA ha fatto crescere costantemente le dimensioni di questi dataset, ma l'introduzione di LLM (Large Language Model) come quelli su cui si basano ChatGPT e altre piattaforme d’IA generative ha provocato l'incremento di un intero ordine di grandezza delle dimensioni e della complessità", spiega Umberto Galtarossa, Partner Technical Manager di Pure Storage. "Ciò accade perché i pattern di conoscenza appresi che emergono durante il processo di training dei modelli di IA devono essere memorizzati, il che può diventare davvero difficile con i modelli di più grandi dimensioni. Anche il checkpointing di modelli vasti e complessi applica un'enorme pressione sull'infrastruttura storage e di rete sottostante, dal momento che il modello non può procedere fino a quando tutti i dati interni non siano stati salvati nel checkpoint – un punto di ripristino o di riavvio a cui si ricorre nel caso in cui il job vada in crash o il gradiente di errore non migliori".

Sintetizzando il discorso molto tecnico di Galtarossa, il punto è che maggiore è il volume dei dati che si prende in considerazione, migliore sarà la qualità delle risposte generate dagli algoritmi di IA. E in effetti l'utilizzo di dati per questo tipo di applicazioni sta crescendo in maniera esponenziale. Fatto che porta a due problemi: prima di tutto le aziende dovranno potenziare le infrastrutture di storage per gestire gli LLM, con un conseguente aumento dei costi. Non solo: aumenteranno anche le emissioni di CO2. E, in questo periodo storico che vede le aziende di qualsiasi settore impegnate nella decarbonizzazione, è un nodo da non trascurare se si vuole raggiungere la neutralità carbonica.

La ricetta di Pure Storage: memorie flash al posto dei dischi fissi

Secondo Galtarossa, la soluzione ideale a questi problemi è adottare i dischi flash. "Alcuni vendor tecnologici stanno già affrontando gli aspetti legati alla sostenibilità nel design dei loro prodotti - spiega il manager - Per esempio, le soluzioni storage all-flash sono notevolmente più efficienti rispetto alle loro controparti HDD a dischi rotanti. Alcuni vendor stanno andando addirittura oltre gli SSD commerciali creandosi propri moduli flash che permettono agli array all-flash di comunicare direttamente con lo storage raw, un accorgimento che massimizza la capacità flash e offre migliori livelli di prestazioni, utilizzo di energia ed efficienza".

SSD e memorie flash, infatti, richiedono molta meno energia e dissipano meno calore rispetto ai tradizionali dischi magnetici, che richiedono particolari sistemi di raffreddamento. 

PURE-STORAGE flash array

Per Galtarossa, però, la sostenibilità ambientale è solamente uno dei vantaggi che porta l'adozione di dischi Flash, che sono più adatti a questo tipo di carichi di lavoro in quanti la chiave dei risultati in questo ambito risiede nella connessione dei modelli IA o delle applicazioni d’IA ai dati. "Per poter far bene questo occorrono tipologie di dati variegate e di grandi dimensioni, bandwidth a disposizione dello streaming per i processi di apprendimento, prestazioni in scrittura per il checkpointing (e per i ripristini dei checkpoint) e prestazioni in lettura casuale per l'inferenza; tutto questo, inoltre, deve essere affidabile e facilmente accessibile su base 24x7 attraverso i vari silos e le varie applicazioni. Questo insieme di caratteristiche non è possibile se alla base delle operazioni si trova storage HDD: occorre la tecnologia all-flash".

0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^