Red Hat Intelligenza Artificiale Open Source

Red Hat lancia AI Inference Server: qualunque modello, su qualunque acceleratore, su qualunque cloud

di Riccardo Robecchi pubblicata il 26 Maggio 2025, alle 14:41 nel canale IA business

Red Hat AI Inference Server punta a offrire un ambiente in cui eseguire i modelli d'IA indipendentemente da ciò che sta sotto di esso, e dunque indipendentemente da GPU o ambiente cloud

L'intelligenza artificiale generativa è diventata pervasiva in pochissimo tempo e già moltissime aziende la impiegano nelle proprie attività. Gestirla correttamente è però complesso e per questo Red Hat ha annunciato il lancio di Red Hat AI Inference Server, che punta a semplificare la scelta dei modelli, la loro implementazione e la successiva gestione.

Red Hat lancia AI Inference Server

Implementare correttamente l'intelligenza artificiale generativa implica tante scelte: il modello, l'acceleratore su cui eseguirlo, il sistema alla base, il cloud in cui si trova tale sistema... Red Hat AI Inference Server è pensato per offrire una base comune su cui adagiare il modello prescelto, indipendentemente dall'acceleratore e dall'operatore di cloud prescelto, con strumenti che consentono di ottimizzarne l'esecuzione.

AI Inference Server si avvale del progetto vLLM, avviato dall'università di Berkeley nel 2023 e in grado di supportare moltissimi modelli: sono inclusi DeepSeek, Google Gemma, Llama, Llama Nemotron, Mistral e Phi, tra gli altri. Tutti questi modelli vengono ottimizzati in modo tale da supportare più GPU, contesti di input più grandi e batching continuo. AI Inference Server offre poi strumenti per comprimere i modelli ed effettuarne l'affinamento, così da migliorarne l'accuratezza riducendone al contempo i requisiti in termini di potenza di calcolo (e, quindi, di consumo energetico).

Red Hat AI Inference Server è pensato per essere eseguito sia come servizio a sé stante, sia come parte di Red Hat Enterprise Linux AI e Red Hat OpenShift AI.

"L'inferenza è ciò che fa avverare le promesse dell'IA generativa, dove alle interazioni degli utenti corrispondono risposte accurate e veloci da un dato modello, ma [l'inferenza] dev'essere messa a disposizione in modo efficace ed efficiente dal punto di vista dei costi", ha affermato Joe Fernandes, vice presidente e general manager della AI Business Unit di Red Hat. "Red Hat AI Inference Server è pensato per incontrare la domanda di sistemi d'inferenza ad alte prestazioni e reattivi mantenendo bassa la richiesta di risorse, così da fornire uno strato comune per l'inferenza che supporti qualunque modello, su qualunque acceleratore e in qualunque ambiente."

I migliori sconti su Amazon oggi

-43%

LG QNED 65'', Serie 85 2024, 65QNED85T6C, Smart TV 4K, Processore

1499.00 859.00€ Compra ora

-23%

Apple Watch SE (2ª gen.) GPS 40 mm Smartwatch con cassa in alluminio Mezzanotte e Cinturino Sport Mezzanotte - S/M. Tracker per il fitness e il sonno, app Battito, Rilevamento incidenti

259.00 199.00€ Compra ora

-23%

CMF Phone 2 Pro 128GB – Smartphone 5G con Fotocamera da 50MP e Zoom 20x, Display AMOLED FHD+ 6,77" a 120Hz, Batteria da 5000mAh e Nothing OS 3.2 – Arancione

259.00€ Compra ora

Ecco tutti gli smartwatch Amazfit ora in offerta, a cominciare da Active 2 (121€): elegante, completo e ora costa meno

Esordio in Svizzera per il "ferrovoltaico": pannelli fotovoltaici sui binari del treno

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

VIDEO IN EVIDENZA

TOPICS

tutti gli articoli »

tutte le news »

Gigabyte Aero X16 Copilot+ PC: tanta potenza non solo per l'IA Un notebook che punta sull'abbinamento tra potenza di calcolo, schermo ampio e dimensioni nel complesso compatte. Gigabyte Aero X16 Copilot+ PC si trasporta facilmente,...

Recensione REDMAGIC Astra Gaming Tablet: che spettacolo di tablet! Il REDMAGIC Astra Gaming Tablet rappresenta una rivoluzione nel gaming portatile, combinando un display OLED da 9,06 pollici a 165Hz con il potente Snapdragon 8...

Dopo un mese, e 50 foto, cosa abbiamo capito della nuova Nintendo Switch 2 Dopo un mese di utilizzo intensivo e l'analisi di oltre 50 scatti, l'articolo offre una panoramica approfondita di Nintendo Switch 2. Vengono esaminate le caratteristiche...

Fujifilm X-E5: la Fuji X che tutti gli appassionati volevano Dopo il fascino un po’ elitario della GFX100RF e le polemiche intorno a x Half, la nuova Fujifilm X-E5 riporta tutti d’accordo: una mirrorless compatta, leggera,...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HPE Discover 2025: tra agenti intelligenti, infrastruttura AI-native e un futuro ibrido Edge9 ha seguito da vicino HPE Discover 2025 con accesso esclusivo a keynote e interviste. Dalla Sphere di Las Vegas, la visione di un’infrastruttura AI-native e...

Nuova Ford Capri elettrica, la super prova: in viaggio, in città e in autostrada Dopo diverse prove, da poche ore al volante, fino a un'intera settimana come prima auto, possiamo riportarvi tutti i dettagli e le impressioni sulla Ford Capri elettrica...

Roborock Saros Z70: un braccio meccanico per fare ordine in casa Dotato di tutte le ultime innovazioni in tema di aspirazione della polvere e pulizia dei pavimenti di casa, Roborock Saros Z70 integra un braccio meccanico che promette...

Red Hat lancia AI Inference Server: qualunque modello, su qualunque acceleratore, su qualunque cloud

Red Hat lancia AI Inference Server

LG QNED 65'', Serie 85 2024, 65QNED85T6C, Smart TV 4K, Processore

Apple Watch SE (2ª gen.) GPS 40 mm Smartwatch con cassa in alluminio Mezzanotte e Cinturino Sport Mezzanotte - S/M. Tracker per il fitness e il sonno, app Battito, Rilevamento incidenti

CMF Phone 2 Pro 128GB – Smartphone 5G con Fotocamera da 50MP e Zoom 20x, Display AMOLED FHD+ 6,77" a 120Hz, Batteria da 5000mAh e Nothing OS 3.2 – Arancione

0 Commenti