Intelligenza ArtificialeGoogle CloudGemini

Google Gemini: disponibile Studio AI, lo strumento per sviluppare app basate sul nuovo LLM

di pubblicata il , alle 16:01 nel canale data Google Gemini: disponibile Studio AI, lo strumento per sviluppare app basate sul nuovo LLM

Dopo aver presentato il suo nuovo modello di IA, Gemini, Google rende disponibili gli strumenti per sviluppatori. A partire da Studio AI, soluzione no code che si integra con Vertex AI e altri IDE. Svelato anche il nuovo generatore di immagini Imagen 2

 

Poco dopo l'annuncio ufficiale di Gemini, il nuovo LLM di Google che, secondo il colosso, è in grado di battere tutti gli altri sistemi di IA, Big G ha reso pubblici maggiori dettagli su Gemini Pro, la versione per sviluppatori, e sugli strumenti che questi ultimi avranno a disposizione per integrare l'IA generativa all'interno delle loro applicazioni. 

google gemini

Prima di iniziare, però, va sottolineato un dettaglio non da poco: come abbiamo spiegato qui, Google non è stata estremamente trasparente durante la presentazione di Gemini. Il video era montato in modo da far sembrare l'IA molto più potente di quanto è in realtà, e quindi è inevitabile un po' di scetticismo nel trattare l'argomento. Va anche detto che gli annunci presentati durante una conferenza online di Google in questo caso non si concentravano sulle potenzialità della tecnologia, quando sugli strumenti che Big G sta mettendo in mano agli sviluppatori.

Arrivano Gemini Pro e gli strumenti per sviluppatori

Gemini è il nuovo modello di IA di Google ed è disponibile in tre versioni. La Nano, pensata per i dispositivi mobile come gli smartphone. La versione PRO è quella su cui si baserà Bard, l'IA di Google accessibile a tutti via web, e poi la Ultra, che gira su hardware dedicato ed è pensata per le esigenze delle grandi aziende. 

google AI Studio

In questo articolo ci concentreremo sugli strumenti per Gemini Pro che Google ha da oggi reso disponibili agli sviluppatori, a partire da AI Studio. Si tratta di un'applicazione accessibile via web che consente di sviluppare applicazioni accedendo alle API di Gemini Pro, disponibile da oggi. Attualmente, è accessibile gratuitamente: basta registrarsi con il proprio account Google per avere accesso a 60 richieste per minuto, 20 volte più di qualsiasi altra offerta sul mercato, sostiene la multinazionale. 

Una volta realizzati i prompt utili all'applicazione che si sta sviluppando, il codice può essere poi esportato in Vertex AI, che consente un maggior controllo sui dati e, almeno sulla carta, garantisce una maggiore privacy dei dati aziendali. Un aspetto che sottolinea Google è il fatto che i dati dei clienti non verranno utilizzati per addestrare ulteriormente il modello, ma rimarranno privati e limitati al proprio account. Si tratta di un punto chiave, dal momento che spostando il codice su Vertex AI gli sviluppatori 

vertex AI gemini

Dagli esempi mostrati durante il webinar di presentazione, tutto sembra essere semplicissimo da usare: ci è stato mostrato come un utente può scrivere un prompt in tempo reale su Google Studio, anche caricando testo e immagini di corredo, e cliccare su RUN per ottenere una risposta. Successivamente, basteranno pochi clic per ottenere una API Key da usare per le applicazioni che faranno leva su questi prompt. Il codice derivante (disponibile in più linguaggi di programmazione) potrà poi essere esportato su Vertex AI o qualsiasi altro ambiente di sviluppo. Il vantaggio di spostare tutto su Vertex AI è che si tratta di uno strumento low code/no code per creare chatbot e agenti virtuali che permette anche di addestrare il modello, in tutta sicurezza e rispetto per la privacy, su dati personali, come quelli che fanno parte del patrimonio aziendale. 

gemini pro price

Se attualmente l'utilizzo di Gemini PRO è gratuito, pur limitato a 60 richieste al minuto, più avanti si passerà a un modello a pagamento, che avrà un costo di 0,00025 dollari per ogni 1000 caratteri generati o 0,0025 dollari per ogni singola immagine generata da prompt. 

Sempre tramite Vertex AI gli utenti avranno modo di accedere anche al modello Gemini Ultra in futuro, anche se la funzionalità al momento è disponibile solo per un gruppo selezionato di clienti. 

Imagen 2 è ora disponibile tramite Vertex AI

Imagen 2 è la nuova versione del generatore di immagini basato su prompt ed è attualmente accessibile a un gruppo limitato di sviluppatori (ma a breve verrà aperto a tutti). Si basa sulla tecnologia DeepMind di Google ed è in grado di generare immagini fotorealistiche di altissima qualità, a quanto afferma Big G.

Imagen 2 gemini

Come Imagen 1, è in grado di descrivere il contenuto delle foto, e ciò che lo differenzia dalla precedente incarnazione sono due funzionalità che potrebbero essere effettivamente molto utili all'atto pratico: la possibilità di generare loghi, che potranno poi essere sovrapposti alle immagini generate, e testi da inserire nelle immagini. Proprio la capacità di realizzare testi è quella più interessante, dal momento che questo è al momento uno dei punti deboli degli attuali strumenti per generare immagini a partire da testo. 

Purtroppo, ci sono state mostrate solamente alcune immagini, ma non abbiamo avuto modo di vedere una dimostrazione in tempo reale di come sono state generate. Considerato come è stato montato ad arte il video di presentazioni di Gemini, riteniamo sia opportuno prendere con le pinze le affermazioni di Google.

Al momento, Imagen 2 supporta sette lingue: inglese, cinese, indi, giapponese, coreano, portoghese e spagnolo. 

Disponibili Duet AI per sviluppatori e per la sicurezza informatica

Insieme a Studio AI Google ha reso disponibili per tutti anche Duet AI for Developers e Duet AI in Security Operations. Si tratta a tutti gli effetti di assistenti virtuali che supporteranno gli utenti nella scrittura di codice e nella gestione della sicurezza informatica della propria infrastruttura. 

Google Duet AI develepers

Con Duet AI for Developers Google vuole portare l'IA generativa all'interno degli ambienti di sviluppo, così da velocizzare e semplificare il processo. Duet AI for Developers è in grado di scrivere porzioni di codice, automatizzare una serie di azioni ripetitive (come il commento al codice), velocizzare il debugging grazie a strumenti di IA in grado di sintetizzare l'output dei log e spiegare con precisione il significato degli errori. 

google gemini security

A breve, inoltre, verranno introdotte nuove funzionalità che consentiranno di suggerire codice non sulla base del materiale pubblico su cui è addestrata l'IA, ma anche sul codice interno generato dalle imprese. Sotto questo profilo Google rassicura i suoi utenti, sottolineando che sono state introdotte funzionalità evolute per la privacy e per assicurare la conformità normativa. 

Duet AI for Security Operations, invece, è uno strumento progettato per aiutare i team IT a gestire gli aspetti di sicurezza della propria infrastruttura. La knowledge base è quella di Mandiant, azienda di sicurezza statunitense che Google ha recentemente acquisito. Questo assistente virtuale può risultare utile per velocizzare l'analisi dei log, per sintetizzare rapidamente i fatti salienti di un incidente informatico e per ottenere suggerimenti su come gestire le operazioni di mitigazione di un incidente. 

Duet AI workspace

Nel 2024, infine, sarà disponibile una versione di Duet AI integrata in Google Workspace.

MedLM: l'IA generativa a supporto del settore sanitario

Google ha già sperimentato con l'IA in campo sanitario realizzando una versione del suo LLM PaLM dedicata proprio all'healthcare e chiamata Med-PaLM. Ora la multinazionale si è spinta oltre e ha annunciato MedLM, una serie di foundation model che sono stati ottimizzati per le specifiche esigenze di chi opera nella sanità. 

Attualmente, ci sono due modelli sotto MedLM, costruiti su Med-PaLM 2. Il primo modello MedLM è più ampio e progettato per compiti complessi. Il secondo, invece, è un modello medio, in grado di essere ottimizzato e ideale per la scalabilità tra le attività. Lo sviluppo di questi modelli è stato guidato dalle specifiche esigenze dei clienti nel settore sanitario e delle scienze della vita, come rispondere alle domande mediche di un operatore sanitario e redigere riassunti. Nei prossimi mesi, Google introdurrà nuovi modelli basati su Gemini nella suite MedLM, così da ampliarne le funzionalità.

Al momento, MedLM è accessibile solo dagli utenti statunitensi. 

1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Unrue14 Dicembre 2023, 10:14 #1
Siete sicuri che sia accessibile a tutti? A me non fa accedere. Dopo il login, vado a chiedere la APi Key ma mi dice:

Access restricted
You do not have permission to view this page.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
^