ClouderaIntelligenza ArtificialeHybrid cloud

Cloudera punta su cloud privato e intelligenza artificiale (che serve anche a guarire le malattie rare)

di pubblicata il , alle 18:21 nel canale IA business Cloudera punta su cloud privato e intelligenza artificiale (che serve anche a guarire le malattie rare)

Dati per l'intelligenza artificiale, ma anche IA per gestire i dati. E il grande ritorno delle infrastrutture fuori dal cloud. Questi e altri i temi toccati alla conferenza Evolve 2025 di Cloudera

 

Centro di Londra. Traffico intenso. Vicino alla Torre di Londra sorge l'Old Billingsgate, che per 500 anni è stato un mercato del pesce (e per un certo periodo è stato il più grande al mondo) e che ora è un centro convegni. È questo il luogo scelto da Cloudera per annunciare le ultime novità alla conferenza EVOLVE25. Se non avete mai sentito parlare di Cloudera, non siete i soli: il CEO, Charles Sansbury, apre un incontro con la stampa internazionale dicendo "i nostri clienti dicono che non sentono mai parlare di noi, che siamo il segreto tenuto meglio nel settore. Due anni fa ero convinto che fosse una cosa buona, oggi stiamo organizzando conferenze come questa per farci conoscere." È uno di quei casi in cui un'azienda ha ottenuto un successo straordinario senza marketing: aziende ed enti governativi (incluso, peraltro, il Comune di Milano) usano Cloudera. Alla conferenza, l'azienda ha annunciato novità significative che rendono la sua piattaforma più flessibile e più in linea con le necessità legate all'IA dei suoi clienti.

Una sola piattaforma, dovunque

Si parla spesso di cloud privato e cloud pubblico come separati, e per buone ragioni: spesso il cloud privato non offre le stesse funzionalità e la stessa semplicità d'uso e di manutenzione del cloud pubblico. Ma ciò avviene anche perché spesso il software che viene usato nel cloud privato è diverso da quello nel cloud pubblico. Unificare le due piattaforme è una sfida che le aziende (e useremo questo termine in senso lato, includendo anche gli enti pubblici) si trovano ad affrontare e che risulta piuttosto pressante.

L'era del passaggio "obbligato" al cloud pubblico, in cui si correva per spostare tutta la propria infrastruttura IT sugli hyperscaler, è ufficialmente finita, secondo quanto dice il CTO di Cloudera, Sergio Gago. "Si parlava di 'lift and shift', ma di fatto si faceva solo 'lift'", dice Gago riferendosi al fatto che le aziende spesso spostavano le proprie applicazioni sul cloud senza però poi riscriverle per ottenere quei vantaggi come innovazioni nei propri processi e migliore gestione dei dati. Il cloud pubblico si è rivelato dispendioso, senza necessariamente offrire dei vantaggi netti, almeno per le aziende di grandi dimensioni e gli enti governativi che Cloudera vede come i propri clienti-tipo. E oltre a tutto ciò, è arrivata ora l'IA, assieme a nuove normative sul trattamento dei dati: questo mix di elementi fa sì che molte realtà puntino a sviluppare il proprio cloud privato, che vedono come più facile da controllare in termini sia di costi, sia di riservatezza.

Ma non è solo una questione di normative o di costi. Spesso è una questione di strategia e di opportunità. Tenere i dati sulla propria piattaforma, poterli gestire liberamente, avere maggiore controllo su tutto il loro ciclo di vita, sono tutti elementi importanti. In breve, si parla di "sovranità sui dati", un tema che è diventato centrale negli ultimi anni e che viene in questo caso declinato sotto forma di "sovranità aziendale", più che nazionale come avviene normalmente. Il cloud ibrido è dunque il modello che viene visto come il migliore compresso: il cloud pubblico offre risorse inaccessibili al cloud privato, mentre quest'ultimo offre controllo (sui dati, sui costi, ecc) e prevedibilità.

In questo contesto non stupisce, dunque, che la novità principale annunciata da Cloudera sia l'unificazione della sua piattaforma. Finora i Cloudera Data Services erano divisi su varie piattaforme: AWS, Google, Microsoft, Oracle e cloud privato, con una certa frammentazione; i Cloudera Data Services 1.5.5 portano con sé proprio la possibilità di usarli sulle infrastrutture on premise. Entro la metà del prossimo anno, questa divisione sarà però un ricordo del passato: i Cloudera Data Services 2.0 saranno infatti un'unica piattaforma, costruita con la stessa base di codice, per tutte le possibili infrastrutture.

Il cloud, ma ibrido: il vecchio nuovo paradigma da seguire

Il motivo di questa scelta sta nel fatto che, come ci spiega il Chief Product Officer Leo Brunnick, "se sei Bank of America, ExxonMobil, o una società di telecomunicazioni, i tuoi dati sono unici e ti permettono di mandare avanti il tuo business, e quindi non andranno mai sul cloud. E quindi stanno cercando di capire come addestrare i modelli su questi dati senza esporli."

Charles Sansbury ci ha detto che "le aziende si sono rese conto in tutto il mondo che la loro architettura finale non sarebbe stata completamente nel cloud, ma ibrida. È per questo che Michael Dell e Jensen Huang, persone piuttosto ponderate, hanno cominciato a parlare d'infrastrutture ibride e della loro importanza. Siamo l'unica azienda che fornisce gestione dei dati, osservabilità e controllo su più piattaforme di calcolo: on premise, cloud privato e cloud pubblico."

Il riferimento a Dell e Huang non è casuale. Cloudera ha infatti annunciato proprio ad EVOLVE 2025 una collaborazione con Dell, che metterà a disposizione server dotati di GPU NVIDIA con il software di Cloudera già installato e configurato per ridurre al minimo il tempo speso per la messa in opera. "Si tratta effettivamente di un'architettura di riferimento, qualcosa che si può mettere al lavoro velocemente. Ci sono alcuni corsi per certi casi d'uso, un po' come fossero delle ricette. Non c'è un'applicazione fatta e finita e pronta all'uso, ma c'è una ricetta su come può funzionare", ci dice Sansbury. "Dell è sempre stata, storicamente, un nostro grande partner, ed è anche un nostro cliente. E lavoriamo con NVDIA da un po' di tempo, sviluppando insieme software per migliorare od ottimizzare le prestazioni sul suo hardware."

Gago afferma durante la presentazione introduttiva della conferenza che è sufficiente un'ora per installare e mettere in opera i servizi su un'infrastruttura privata. Ciò è possibile grazie alla recente acquisizione di Taikun, che ha messo a disposizione di Cloudera gli strumenti necessari per rendere i suoi servizi basati su Kubernetes e, dunque, containerizzati, il che significa che lo stesso identico software può essere messo in opera dovunque. E questo "dovunque" include anche AWS Sovereign Cloud in Europa, ovvero la versione del cloud pubblico che garantisce il pieno controllo sui dati.

L'ulteriore conseguenza è che le aziende avranno una sola piattaforma per gestire tutti i propri dati, dovunque essi siano: sui vari hyperscaler o nel proprio data center. Il che è fondamentale per il passaggio successivo: l'intelligenza artificiale.

Dati per l'IA, IA per i dati

È un dato noto che l'IA abbia bisogno di dati di qualità, e in grande quantità. Per questo avere una sola piattaforma con cui poterli gestire tutti diventa particolarmente importante. Cloudera ha aggiunto molte funzionalità che rendono più semplice sviluppare modelli d'IA e applicazioni che ne fanno uso, ad esempio tramite connettori che consentono di semplificare l'interfaccia.

Ma non solo: il nuovo AI Studio mette a disposizione molteplici strumenti integrati con la piattaforma, che consentono quindi di accedere a tutte le sue funzionalità in maniera facilitata. È presente anche uno strumento per costruire agenti d'IA usando una quantità minima di codice e sfruttando un processo grafico con drag and drop, che rende molto semplice creare agenti in grado di agire con e sui dati mantenendo il pieno controllo di quali dati possono essere utilizzati.

Un'altra acquisizione, quella di Octopai, consente a Cloudera di offrire un servizio proprio in questo ambito. Octopai consente di effettuare una mappatura dei dati e delle loro origini: in questo modo le aziende possono sempre sapere dove sono i dati e da dove arrivano. Non si tratta di un dettaglio tecnico: non tutti i dati sono utilizzabili liberamente, poiché in alcuni casi sono riservati, soggetti a restrizioni normative, o sono presenti altre limitazioni che fanno sì che sia importante sapere da dove arrivano e chi possa accedervi.

È in un certo senso ironico che Octopai sfrutti proprio l'IA per fare il suo lavoro. Ma questo è il punto: non solo i dati servono per l'IA, ma l'IA serve per i dati. Cloudera afferma che sia fondamentale impiegare l'IA per gestire i propri dati così da semplificare molte altre operazioni come la gestione dell'infrastruttura, delle applicazioni, dello sviluppo di codice e del supporto.

Octopai funziona anche sul cloud privato. Ritorna così il tema dell'uso di infrastrutture private anche per l'IA: secondo Cloudera, un suo cliente ha rilevato che il cloud pubblico funzioni per l'IA solo fino a un certo punto. Quando un'azienda usa almeno 100 diversi modelli (inteso come "100 istanze"), diventa più economico "tenere in casa" l'infrastruttura IT che sottostà alle applicazioni, anche perché i costi maggiori sono legati alle persone e non aumentano significativamente all'aumentare delle dimensioni dell'infrastruttura.

Non sorprende, dunque, vedere che Cloudera ha deciso di reimpostare la sua strategia per coprire anche i casi d'uso in cui si parla di cloud privato o d'infrastrutture on premise: con la rinascita e l'espansione delle infrastrutture ibride, anche e forse soprattutto per alimentare l'IA, poter dare ai propri clienti un'offerta completa e che va loro incontro, anziché chiedere loro di spostarsi interamente sul cloud.

A cosa serve tutto questo: una cura per delle malattie rare

Durante l'intervista con Charles Sansbury è emerso un caso particolare in cui la tecnologia di Cloudera si è rivelata particolarmente utile. "Un nostro cliente è un'azienda che fa ricerca farmaceutica e ha 30 o 40 anni di dati di sperimentazioni cliniche e ricerche in vari Paesi e in varie lingue. Un po' sono dati strutturati, un po' sono appunti nei quaderni."

Il problema di questa situazione era effettuare ricerche all'interno di questi dati, che a volte non erano nemmeno digitalizzati e quindi inaccessibili ai ricercatori in altre sedi, o magari in lingue differenti. "L'obiettivo era poter effettuare ricerche semantiche e parlare ai dati, per fare domande e scoprire relazioni tra molecole che avevano provato e specifici geni su cui avrebbero potuto funzionare", ci ha detto Sansbury. L'azienda ha quindi sviluppato un progetto per inserire una data mesh al di sopra dei dati, così da poter poi usare l'intelligenza artificiale per interrogarli.

"Hanno fatto dei test e hanno stimato che avrebbero risparmiato 200 milioni di dollari l'anno in ricerca e sviluppo, ma c'è stato un effetto imprevisto. Le malattie rare sono quelle malattie che magari affliggono 500 persone [in tutto il mondo]; nessuno farà mai ricerca. Ma l'azienda sa che questo gene interagisce con questa molecola organica e ci sono stati un paio di casi in cui sono stati in grado di offrire miglioramenti ai pazienti con queste malattie rare per via di questa data mesh che mette insieme tutti i dati. Quindi sì, risparmiano centinaia di milioni di dollari, ma in alcuni casi salvano anche delle vite. E ciò non sarebbe stato possibile senza la robustezza della data mesh che abbiamo installato intorno ai loro dati."

E questo dovrebbe essere, in fin dei conti, il vero motivo per sviluppare e adottare queste nuove tecnologie: perché consentono di offrire nuove cure per malattie altrimenti incurabili e salvare vite che altrimenti si spegnerebbero.

0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
^