Per Huawei l’IA è una questione di storage. Presentate soluzioni dedicate e un SSD da 128 TB

Per Huawei l’IA è una questione di storage. Presentate soluzioni dedicate e un SSD da 128 TB

Inizia l’era dell’AI storage. Durante l’Innovative Data Infrastructure Forum 2024, Huawei ha presentato OceanStor A800, una soluzione innovativa pensata per i carichi di lavoro legati all’intelligenza artificiale generativa

di pubblicato il nel canale Device
Huaweiintelligenza artificiale
 

L'economista Micheal Porter, famoso per aver coniato il concetto di vantaggio competitivo, troverebbe sicuramente degli spunti interessanti dall'evoluzione del mercato dello storage. Per anni lo storage, nonostante la costante evoluzione tecnologica che dai dischi meccanici ha portato ai più performanti SSD, è stato considerato una commodity, quasi un male necessario. Lo scenario sta decisamente cambiando negli ultimi anni: la centralità dei dati nei processi aziendali e l'esplosione dell'intelligenza artificiale stanno cambiando il ruolo stesso dello storage.

Huawei_IDI_2024

Oggi storage non significa più solo avere a disposizione dello spazio dove archiviare i dati, perché è anche indispensabile avere un livello esponenzialmente più elevato di prestazioni per poter archiviare e accedere ai dati in tempi rapidissimi. Oltre alle prestazioni è fondamentale avere un sistema di gestione dello storage che garantisca un elevato livello di sicurezza e che permetta di accedere ai dati indipendentemente da dove sono archiviati fisicamente.Nel recente passato abbiamo assistito a diversi approcci per la gestione del patrimonio di dati aziendale, dal molto strutturato data warehouse al più "fluido" data lake. La soluzione che si sta affermando per le aziende più "data intensive" è il data fabric. È interessante vedere il risultato di una ricerca su Google del termine "data fabric", in pratica si ottiene una panoramica dei principali attori del mercato IT globale: IBM, SAP, HPE, Appian, Pure Storage, Cloudera. Molto spesso, però, una semplice ricerca Google non offre una fotografia esaustiva e fra i risultati che abbiamo ottenuto manca sicuramente, fra gli altri, un nome importante: Huawei.

Huawei IDI Forum 2024: arriva l’AI storage

A inizio maggio abbiamo partecipato a Berlino all'evento Huawei Innovative Data Infrastructure Forum 2024 ed è stata l'occasione per avere un'importante conferma del ruolo preminente di Huawei nel mercato dello storage. Da quanto dichiara l'azienda, Huawei si posiziona come secondo player al mondo, ma con delle sostanziali differenze a seconda dell'area geografica presa come riferimento. In Cina, come era facile immaginarsi, Huawei è leader incontrastato, mentre sul mercato americano, primariamente USA ma anche negli altri stati limitrofi, è praticamente inesistente. Anche qui nessuna sorpresa: si fanno ancora sentire gli effetti della guerra commerciale fra USA e Cina, che aveva portato anni fa al ban di Huawei nel settore TLC. Ban che, chiaramente, ha delle conseguenze anche in altri settori e che deve aver influito sulla decisione di Huawei di uscire dal mercato dei server, dove è difficile operare senza avere delle relazioni solide con i principali fornitori americani, e che ha portato Huawei a concentrarsi sul mercato dello storage. È in una posizione intermedia il mercato europeo, dove Huawei è presente e dove sta investendo molto per aumentare la sua quota di mercato.

Questa premessa era doverosa per inquadrare Huawei in un settore dove non è necessariamente conosciuta e presa in considerazione da tutte le aziende presenti sul mercato. Chi invece conosce le soluzioni storage di Huawei ha ben presente che non solo sono competitive, ma che, da un punto di vista tecnologico, hanno diversi vantaggi rispetto ai concorrenti.

L'aspetto tecnologico è quello che, in fin dei conti, interessa di più a Edge9 e durante l'evento di Berlino è emerso come il gap rispetto ai concorrenti si stia ampliando. L'intervento più significativo è stato quello di Peter Zhou, President of Data Storage Product Line, che nel ripercorrere l'evoluzione del data storage ha sottolineato come l'avvento dell'IA generativa renda necessario un nuovo concetto di gestione dello storage. Zhou lo definisce come AI Storage e deve avere delle caratteristiche ben definite per poter supportare al meglio i presenti e futuri sviluppi dell'IA. I parametri che, fino ad oggi, hanno definito le dimensioni dello storage tradizionale sono sostanzialmente tre: prestazioni, il paradigma dei dati e l'affidabilità. Questi tre rimangono anche in ambito IA, ma si potenziano e vengono affiancati da tre nuovi parametri: scalabilità, sostenibilità e data fabric. Huawei ha una sua visione molto chiara di cosa sia necessario affinché una soluzione di storage possa essere considerata "AI ready" e non si limita alla teoria, ma propone delle soluzioni concrete già disponibili sul mercato.

Huawei_IDI_2024

Prima di parlare dei prodotti veri e propri, vediamo parametro per parametro cosa è necessario, secondo Huawei. Il primo aspetto da prendere in considerazione è quello delle prestazioni, che devono crescere non in maniera lineare, ma fare un salto di 10x per soddisfare le esigenze dell'IA. Zhou ha fatto un esempio molto concreto per giustificare questa affermazione: attualmente i cluster di GPU dedicati all'IA hanno un tasso di utilizzo inferiore al 50% perché i tempi di preparazione dei dati e dei salvataggi e restore degli snapshot dei modelli, passaggi necessari per come è strutturato il training, sono strettamente legati alle prestazioni dello storage. Parallelamente alle prestazioni deve aumentare l'affidabilità dei sistemi di storage, in questo caso passiamo a quattro decimali, arrivando a >99,9999%, a cui si deve aggiungere la possibilità di rilevare attacchi ransomware, anche qui con percentuali >99,99%. Combinando questi due parametri con tempi inferiori a 1 minuto per recuperare un check point nel training di un modello per l'IA generativa si ottiene quella che Huawei chiama Data Resilience. Quest’ultimo aspetto è molto importante, perché il training avviene su "pacchetti" di dati di dimensioni molto significative ed è indispensabile effettuare il training a blocchi, proprio per l'ingente mole di dati che viene presa in considerazione. Se avviene un inconveniente fra un ciclo e l'altro, si corre il rischio di perdere tutto il training effettuato e quindi "sprecare" l'utilizzo delle GPU, con costi molto significativi.

L'IA generativa assorbe il 50% dell'energia dei data center

I sistemi di storage, negli anni, si sono evoluti per gestire nativamente diversi paradigmi di dati, dove per paradigmi intendiamo ad esempio i dati non strutturati. Con l'IA c'è l'esigenza di poter gestire nuovi paradigmi, già consolidati, come i dati vettoriali o il RAG (Retrieval-Augmented Generation) ed essere pronti a integrare i nuovi paradigmi che emergeranno in futuro. Altri due aspetti importanti sono la scalabilità, per stare dietro alla costante evoluzione delle prestazioni delle GPU, e la sostenibilità. Zhou ha condiviso dei dati impressionanti: già oggi più del 50% dell'energia assorbita da tutti i data center nel mondo è legata, in un modo o nell'altro, all'IA generativa e si stima che nel 2026 il fabbisogno energetico dei data center arriverà a 1050 TWH, l'equivalente dell'intero fabbisogno di un Paese come il Giappone. È quindi essenziale che ogni componente dei data center consumi meno energia, fissando l'asticella per lo storage su un consumo inferiore a 1W/TB.

Huawei_IDI_2024

L'ultimo parametro è un po' il collante di tutti gli altri ed è proprio la data fabric di cui parlavamo prima e che nella visione di Huawei deve garantire la visibilità globale dei dati, la possibilità di gestire in modo efficace i dati, sempre indipendentemente da dove sono fisicamente archiviati, e offrire prestazioni 10 volte superiori nella mobilità dei dati, garantendo al tempo stesso delle pipeline dedicate all'IA.

Peter Zhou ha chiuso il suo keynote all'IDI 2024 presentando una nuova soluzione di storage che, nella visione di Huawei, riesce a rispettare i 6 parametri dell'AI storage: OceanStor A800. L'azienda cinese dichiara che le performance, rispetto al concorrente principale indicato come Vendor D (non ci vuole molta fantasia per identificare chi sia il concorrente che inizia con la D…) sono superiori di 4x in termini bandwidth, passando da 120 GB/s a 500 GB/s e di 8x per gli IOPS, passando da 3 M a 24 M. La soluzione è anche molto scalabile, sicura e sostenibile, con un consumo dichiarato di 0,7 W/TB.

Huawei_IDI_2024-8

Il cuore dell'OceanStor A800 è un nuovo "disco" SSD in formato Palm, sviluppato internamente da Huawei, che arriva all'incredibile capacità di 128 TB. Per avere un'idea, il formato Palm ha dimensioni simili a una scheda grafica half size, anche più sottile. Huawei dichiara che, rispetto a un SSD "standard", per soluzioni da 1 PB sono necessari 8 dischi invece di 67, con un risparmio di spazio dell'88% e il consumo, sempre per una soluzione da 1 PB, della soluzione Huawei è di 112 W, contro 1.340 W di soluzioni standard equivalenti, con un risparmio energetico del 92%. Grazie a questo nuovo disco SSD, a tutti gli effetti un'esclusiva di Huawei, in una singola appliance OceanStor A800 possiamo raggiungere l'esorbitante capacità di 8 Petabye e le elevate prestazioni permettono di aumentare l'utilizzo dei cluster di GPU dedicati all'AI del 30% con oggettivi vantaggi sia in termini economici sia di sostenibilità.

Non sono state date indicazioni sui prezzi di questi sistemi, ma chiaramente stiamo parlando di investimenti importanti e viene quindi da chiedersi quali sono le aziende che possono permettersi di avere un data fabric come quello descritto da Huawei e con questo tipo di prodotti. È invece molto probabile che molti abbiano modo di utilizzare quotidianamente le soluzioni di storage di Huawei. A parte le grandi aziende che costruiscono il proprio data fabric, infatti, un settore molto importante per Huawei è quello degli MSP e dei cloud provider, esclusi gli hyperscaler. Quindi è decisamente possibile che se utilizziamo un server dedicato in hosting, la parte di storage si appoggi su apparati Huawei.

Huawei_IDI_2024

In ogni caso, dal viaggio a Berlino ci portiamo a casa due considerazioni importanti. Una generale, legata all'accelerazione che sta portando anche nel settore dello storage la crescita inesorabile dell'IA. L'altra specifica di Huawei, che ha ulteriormente dimostrato il vantaggio tecnologico che ha acquisito rispetto alla concorrenza ed è notevole come l'azienda cinese continui a trovare sempre nuovi modi non solo per rimanere sul mercato, nonostante i tanti ostacoli che si è trovata a fronteggiare, ma anche di primeggiare. Ognuno ha, anzi deve avere, un suo giudizio personale sulle complesse vicende che sfiorano la geopolitica, ma è invece un dato oggettivo che la resilienza e la capacità di adattamento sono due caratteristiche intrinseche del DNA di Huawei.

0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^