IBM presenta i modelli Granite 3.2 con capacità di ragionamento
di Riccardo Robecchi pubblicata il 03 Marzo 2025, alle 18:01 nel canale Innovazione
IBM ha presentato l'ultima versione dei suoi modelli Granite, la 3.2, che introduce la capacità di ragionamento con miglioramenti significativi nelle prestazioni registrate nei benchmark di settore
IBM ha annunciato il lancio di una nuova versione della sua famiglia di modelli d'IA Granite: sono i modelli Granite 3.2, che includono ottimizzazioni e la capacità di ragionamento, assieme a un nuovo modello linguistico di visione (Vision Language Model, VLM). I nuovi modelli sono disponibili come open source, con licenza Apache 2.0.
IBM annuncia i modelli Granite 3.2
IBM presentò i modelli Granite a THINK 2024. La più grande novità della versione 3.2 dei modelli Granite di IBM sta nell'introduzione di un modello linguistico di visione, che consente di comprendere i documenti; tale modello ha, secondo IBM, prestazioni pari o superiori rispetto a quelle di modelli significativamente più grandi come Llama 3.2 11B o Pixtral 12B.
La seconda novità sta nella capacità di concatenare i ragionamenti nei modelli 2B e 8B; tale funzionalità può essere disabilitata, ma consente di ottenere risultati con miglioramenti a doppia cifra rispetto alla versione precedente. Usando nuovi metodi per portare l'inferenza su larga scala, il modello Granite 3.2 8B può essere reso competitivo con Claude3.5-Sonnet o GPT-4o nei benchmark di ragionamento matematico AIME2024 e MATH500.
Da ultimo, i modelli per la sicurezza Granite Guardian mantengono le prestazioni della versione precedente con, però, una riduzione del 30% delle dimensioni. La nuova versione introduce anche una nuova funzionalità, chiamata "verbalised confidence" (certezza verbalizzata), che offre una valutazione del rischio più sfumata e descrive meglio il livello di certezza di quanto rilevato.
Tutti i modelli della famiglia Granite 3.2 sono disponibili con licenza Apache 2.0, che è considerata tra le più permissive, su Hugging Face, IBM watsonx.ai, Ollama, Replicate, LM Studio e, a breve, su RHEL AI 1.5.
"La prossima era dell'AI riguarda l'efficienza, l'integrazione e l'impatto nel mondo reale, dove le aziende possono ottenere risultati potenti senza spese eccessive di elaborazione", ha affermato Sriram Raghavan, VP di IBM AI Research. "Gli ultimi sviluppi di IBM Granite si concentrano su soluzioni open e rappresentano un ulteriore passo avanti nel rendere l'AI più accessibile, conveniente e di valore per le aziende moderne."
1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".