IA generativa: arrivano i modelli Granite 3.0 di IBM
di Alberto Falchi pubblicata il 22 Ottobre 2024, alle 17:31 nel canale dataI nuovi modelli Granite 3.0 8B e 2B, rilasciati sotto licenza Apache 2.0, offrono prestazioni innovative nei benchmark accademici e aziendali, superando o eguagliando (secondo IBM) modelli open source di dimensioni simili
IBM ha introdotto una nuova famiglia di LLM, Granite 3.0. Questi saranno i modelli predefiniti che adotterà IBM Consulting Advantage, la piattaforma di consulenza di Big Blue basata su watsonX. Grazie a questa novità, i 160.000 consulenti di IBM in tutto il mondo possono utilizzare Granite nei loro progetti, che spaziano dal servizio clienti alla modernizzazione dell'IT, contribuendo a massimizzare il ritorno sugli investimenti in intelligenza artificiale delle aziende.
I modelli Granite 3.0 sono stati addestrati su oltre 12milia miliardi di token e su dati provenienti da 12 lingue e 116 linguaggi di programmazione diversi. Entro la fine dell'anno, i modelli 8B e 2B includeranno anche il supporto per la lunghezza del contesto estesa a 128K e le capacità di comprensione multimodale dei documenti.
Granite 3.0: i nuovo modelli di IA ad alte prestazioni pensati per il business
In occasione del proprio evento annuale TechXchange, IBM ha annunciato la disponibilità dei modelli di IA Granite 3.0, una famiglia di LLM che, secondo l'azienda, superano o eguagliano sui principali benchmark le prestazioni dei modelli di dimensioni simili già disponibili sul mercato.
Si tratta di LLM open source, disponibili con licenza Apache 2.0. Nello specifico, sono disponibili tre tipologie di modelli:
-
Per l'utilizzo generale e la generazione e manipolazione di testi ci sono Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
-
Granite Guardian 3.0 8B, Granite Guardian 3.0 2B sono invece pensati per l'utilizzo nell'ambito della sicurezza e della protezione.
-
Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base, Granite 3.0 1B A400M Base, invece, sono modelli misti.
I modelli compatti Granite 8B e 2B sono pensati per essere addestrati coi dati aziendali. Sono in grado di offrire prestazioni elevate pur mantenendo bassi i costi di implementazione. Supportano la RAG e sono adatti soprattutto ad attività come la classificazione di dati e il riepilogo.
Combinandoli con i dati aziendali e utilizzando metodi di riaddestramento come InstructLab di IBM, questi LLM sono sufficientemente maturi ed evoluti da competere con modelli più grandi, pur costando dalle 3 alle 23 volte in meno.
I benchmark di Granite 3.0
Sui benchmark accademici standard definiti dalla OpenLLM Leaderboard di Hugging Face, le prestazioni del modello Granite 3.0 8B Instruct sono mediamente superiori a quelle dei LLM open-source di dimensioni simili di Meta e Mistral. Nel benchmark di sicurezza AttaQ di IBM, invece, il modello Granite 3.0 8B Instruct è in testa in tutte le dimensioni della sicurezza rispetto ai modelli Meta e Mistral.
Sulle attività di RAG e di cybersecurity, IBM sottolinea che Granite 8B mostra prestazioni complessivamente migliori rispetto ai modelli open-source di dimensioni simili di Mistral e Meta.
I nuovi Granite 3.0 possono essere scaricati senza restrizioni da HuggingFace, mentre Granite 3.0 8B e 2B e i modelli Granite Guardian 3.0 8B e 3B sono disponibili da oggi per uso commerciale sulla piattaforma IBM watsonx. Una selezione dei modelli Granite 3.0 sarà disponibile anche come microservizi NVIDIA NIM e attraverso le integrazioni Vertex AI Model Garden di Google Cloud con HuggingFace.
0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".