Intelligenza Artificiale Google Cloud Gemini

Google Gemini: disponibile Studio AI, lo strumento per sviluppare app basate sul nuovo LLM

di Alberto Falchi pubblicata il 13 Dicembre 2023, alle 16:01 nel canale data

Dopo aver presentato il suo nuovo modello di IA, Gemini, Google rende disponibili gli strumenti per sviluppatori. A partire da Studio AI, soluzione no code che si integra con Vertex AI e altri IDE. Svelato anche il nuovo generatore di immagini Imagen 2

Poco dopo l'annuncio ufficiale di Gemini, il nuovo LLM di Google che, secondo il colosso, è in grado di battere tutti gli altri sistemi di IA, Big G ha reso pubblici maggiori dettagli su Gemini Pro, la versione per sviluppatori, e sugli strumenti che questi ultimi avranno a disposizione per integrare l'IA generativa all'interno delle loro applicazioni.

google gemini

Prima di iniziare, però, va sottolineato un dettaglio non da poco: come abbiamo spiegato qui, Google non è stata estremamente trasparente durante la presentazione di Gemini. Il video era montato in modo da far sembrare l'IA molto più potente di quanto è in realtà, e quindi è inevitabile un po' di scetticismo nel trattare l'argomento. Va anche detto che gli annunci presentati durante una conferenza online di Google in questo caso non si concentravano sulle potenzialità della tecnologia, quando sugli strumenti che Big G sta mettendo in mano agli sviluppatori.

Arrivano Gemini Pro e gli strumenti per sviluppatori

Gemini è il nuovo modello di IA di Google ed è disponibile in tre versioni. La Nano, pensata per i dispositivi mobile come gli smartphone. La versione PRO è quella su cui si baserà Bard, l'IA di Google accessibile a tutti via web, e poi la Ultra, che gira su hardware dedicato ed è pensata per le esigenze delle grandi aziende.

google AI Studio

In questo articolo ci concentreremo sugli strumenti per Gemini Pro che Google ha da oggi reso disponibili agli sviluppatori, a partire da AI Studio. Si tratta di un'applicazione accessibile via web che consente di sviluppare applicazioni accedendo alle API di Gemini Pro, disponibile da oggi. Attualmente, è accessibile gratuitamente: basta registrarsi con il proprio account Google per avere accesso a 60 richieste per minuto, 20 volte più di qualsiasi altra offerta sul mercato, sostiene la multinazionale.

Una volta realizzati i prompt utili all'applicazione che si sta sviluppando, il codice può essere poi esportato in Vertex AI, che consente un maggior controllo sui dati e, almeno sulla carta, garantisce una maggiore privacy dei dati aziendali. Un aspetto che sottolinea Google è il fatto che i dati dei clienti non verranno utilizzati per addestrare ulteriormente il modello, ma rimarranno privati e limitati al proprio account. Si tratta di un punto chiave, dal momento che spostando il codice su Vertex AI gli sviluppatori

vertex AI gemini

Dagli esempi mostrati durante il webinar di presentazione, tutto sembra essere semplicissimo da usare: ci è stato mostrato come un utente può scrivere un prompt in tempo reale su Google Studio, anche caricando testo e immagini di corredo, e cliccare su RUN per ottenere una risposta. Successivamente, basteranno pochi clic per ottenere una API Key da usare per le applicazioni che faranno leva su questi prompt. Il codice derivante (disponibile in più linguaggi di programmazione) potrà poi essere esportato su Vertex AI o qualsiasi altro ambiente di sviluppo. Il vantaggio di spostare tutto su Vertex AI è che si tratta di uno strumento low code/no code per creare chatbot e agenti virtuali che permette anche di addestrare il modello, in tutta sicurezza e rispetto per la privacy, su dati personali, come quelli che fanno parte del patrimonio aziendale.

gemini pro price

Se attualmente l'utilizzo di Gemini PRO è gratuito, pur limitato a 60 richieste al minuto, più avanti si passerà a un modello a pagamento, che avrà un costo di 0,00025 dollari per ogni 1000 caratteri generati o 0,0025 dollari per ogni singola immagine generata da prompt.

Sempre tramite Vertex AI gli utenti avranno modo di accedere anche al modello Gemini Ultra in futuro, anche se la funzionalità al momento è disponibile solo per un gruppo selezionato di clienti.

Imagen 2 è ora disponibile tramite Vertex AI

Imagen 2 è la nuova versione del generatore di immagini basato su prompt ed è attualmente accessibile a un gruppo limitato di sviluppatori (ma a breve verrà aperto a tutti). Si basa sulla tecnologia DeepMind di Google ed è in grado di generare immagini fotorealistiche di altissima qualità, a quanto afferma Big G.

Imagen 2 gemini

Come Imagen 1, è in grado di descrivere il contenuto delle foto, e ciò che lo differenzia dalla precedente incarnazione sono due funzionalità che potrebbero essere effettivamente molto utili all'atto pratico: la possibilità di generare loghi, che potranno poi essere sovrapposti alle immagini generate, e testi da inserire nelle immagini. Proprio la capacità di realizzare testi è quella più interessante, dal momento che questo è al momento uno dei punti deboli degli attuali strumenti per generare immagini a partire da testo.

Purtroppo, ci sono state mostrate solamente alcune immagini, ma non abbiamo avuto modo di vedere una dimostrazione in tempo reale di come sono state generate. Considerato come è stato montato ad arte il video di presentazioni di Gemini, riteniamo sia opportuno prendere con le pinze le affermazioni di Google.

Al momento, Imagen 2 supporta sette lingue: inglese, cinese, indi, giapponese, coreano, portoghese e spagnolo.

Disponibili Duet AI per sviluppatori e per la sicurezza informatica

Insieme a Studio AI Google ha reso disponibili per tutti anche Duet AI for Developers e Duet AI in Security Operations. Si tratta a tutti gli effetti di assistenti virtuali che supporteranno gli utenti nella scrittura di codice e nella gestione della sicurezza informatica della propria infrastruttura.

Google Duet AI develepers

Con Duet AI for Developers Google vuole portare l'IA generativa all'interno degli ambienti di sviluppo, così da velocizzare e semplificare il processo. Duet AI for Developers è in grado di scrivere porzioni di codice, automatizzare una serie di azioni ripetitive (come il commento al codice), velocizzare il debugging grazie a strumenti di IA in grado di sintetizzare l'output dei log e spiegare con precisione il significato degli errori.

google gemini security

A breve, inoltre, verranno introdotte nuove funzionalità che consentiranno di suggerire codice non sulla base del materiale pubblico su cui è addestrata l'IA, ma anche sul codice interno generato dalle imprese. Sotto questo profilo Google rassicura i suoi utenti, sottolineando che sono state introdotte funzionalità evolute per la privacy e per assicurare la conformità normativa.

Duet AI for Security Operations, invece, è uno strumento progettato per aiutare i team IT a gestire gli aspetti di sicurezza della propria infrastruttura. La knowledge base è quella di Mandiant, azienda di sicurezza statunitense che Google ha recentemente acquisito. Questo assistente virtuale può risultare utile per velocizzare l'analisi dei log, per sintetizzare rapidamente i fatti salienti di un incidente informatico e per ottenere suggerimenti su come gestire le operazioni di mitigazione di un incidente.

Duet AI workspace

Nel 2024, infine, sarà disponibile una versione di Duet AI integrata in Google Workspace.

MedLM: l'IA generativa a supporto del settore sanitario

Google ha già sperimentato con l'IA in campo sanitario realizzando una versione del suo LLM PaLM dedicata proprio all'healthcare e chiamata Med-PaLM. Ora la multinazionale si è spinta oltre e ha annunciato MedLM, una serie di foundation model che sono stati ottimizzati per le specifiche esigenze di chi opera nella sanità.

Attualmente, ci sono due modelli sotto MedLM, costruiti su Med-PaLM 2. Il primo modello MedLM è più ampio e progettato per compiti complessi. Il secondo, invece, è un modello medio, in grado di essere ottimizzato e ideale per la scalabilità tra le attività. Lo sviluppo di questi modelli è stato guidato dalle specifiche esigenze dei clienti nel settore sanitario e delle scienze della vita, come rispondere alle domande mediche di un operatore sanitario e redigere riassunti. Nei prossimi mesi, Google introdurrà nuovi modelli basati su Gemini nella suite MedLM, così da ampliarne le funzionalità.

Al momento, MedLM è accessibile solo dagli utenti statunitensi.

I migliori sconti su Amazon oggi

-53%

Amazfit GTR 3, 46 mm, Smartwatch Orologio Intelligente Alexa Integrato, 150 modalità di Allenamento con GPS, AMOLED, Monitor del Sonno, 5 ATM Impermeabile, Durata Batteria di 21 Giorni, SpO2

149.90 69.90€ Compra ora

-20%

DJI Neo, mini drone con fotocamera UHD 4K per adulti, 135g drone che vola da solo e ti segue, decollo dalla mano, tracciamento del soggetto, QuickShot, video stabilizzati, (senza radiocomando)

199.00 159.00€ Compra ora

-30%

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

149.99 104.99€ Compra ora

Sony, nuovo attacco alla sicurezza: trafugati alcuni file di Wolverine, gioco di Insomniac previsto per il 2025

Tesla svela Optimus Gen 2, il robot umanoide di nuova generazione. Ecco il video

Unrue14 Dicembre 2023, 10:14 #1

Siete sicuri che sia accessibile a tutti? A me non fa accedere. Dopo il login, vado a chiedere la APi Key ma mi dice:

Access restricted
You do not have permission to view this page.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

VIDEO IN EVIDENZA

TOPICS

tutti gli articoli »

tutte le news »

HP Elitebook Ultra G1i 14 è il notebook compatto, potente e robusto Pensato per il professionista sempre in movimento, HP Elitebook Ultra G1i 14 abbina una piattaforma Intel Core Ultra 7 ad una costruzione robusta, riuscendo a mantenere...

Samsung Galaxy S25 Edge: il top di gamma ultrasottile e leggerissimo. La recensione Abbiamo provato il nuovo Galaxy S25 Edge, uno smartphone unico per il suo spessore di soli 5,8 mm e un peso super piuma. Parliamo di un device che ha pro e contro,...

Dopo un mese, e 50 foto, cosa abbiamo capito della nuova Nintendo Switch 2 Dopo un mese di utilizzo intensivo e l'analisi di oltre 50 scatti, l'articolo offre una panoramica approfondita di Nintendo Switch 2. Vengono esaminate le caratteristiche...

Fujifilm X-E5: la Fuji X che tutti gli appassionati volevano Dopo il fascino un po’ elitario della GFX100RF e le polemiche intorno a x Half, la nuova Fujifilm X-E5 riporta tutti d’accordo: una mirrorless compatta, leggera,...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HPE Discover 2025: tra agenti intelligenti, infrastruttura AI-native e un futuro ibrido Edge9 ha seguito da vicino HPE Discover 2025 con accesso esclusivo a keynote e interviste. Dalla Sphere di Las Vegas, la visione di un’infrastruttura AI-native e...

Nuova Ford Capri elettrica, la super prova: in viaggio, in città e in autostrada Dopo diverse prove, da poche ore al volante, fino a un'intera settimana come prima auto, possiamo riportarvi tutti i dettagli e le impressioni sulla Ford Capri elettrica...

Roborock Saros Z70: un braccio meccanico per fare ordine in casa Dotato di tutte le ultime innovazioni in tema di aspirazione della polvere e pulizia dei pavimenti di casa, Roborock Saros Z70 integra un braccio meccanico che promette...