L’intelligenza artificiale è in grado di interpretare testi, immagini, audio, video e codice: Gemini 1.0 è in tre diverse versioni: Ultra, Pro e Nano
Era nell’aria da un po’, ma Big G ha imposto un’accelerazione rispetto ai rumors che lo collocavano nel 2024, e ieri ha svelato al mondo Gemini, un nuovo modello di intelligenza artificiale che, nelle intenzioni di Google, per niente velate e anzi rivendicate con decisione, è la risposta alla rivale OpenAI e al suo ChtGPT. L’AI targata Google ha due caratteristiche che la distinguono da tutti gli altri progetti messi finora in campo: è multimodale – ovvero è in grado di comprendere e operare attraverso diverse tipologie di informazioni: non solo testuali, scritte, ma anche immagini, audio, video e codice – e flessibile – è in grado cioè di adattarsi alla macchina su cui gira (sia essa uno smartphone o una machina più complessa, per esempio un data center) per ottimizzare funzioni e prestazioni.
“Gemini è il modello IA più capace e potente che abbiamo mai costruito. È progettato fin dalle sue fondamenta per essere multimodale e ottimizzato per tre diverse dimensioni: Ultra, Pro e Nano – ha spiegato Sundar Pichai, Ceo di Google e Alphabet – A quasi otto anni dall’inizio del nostro percorso come azienda AI-first, il ritmo del progresso non fa che accelerare: milioni di persone utilizzano ora l’intelligenza artificiale generativa nei nostri prodotti per fare cose che solo un anno fa non avrebbero potuto fare, da trovare risposte a domande sempre più complesse, all’uso di nuovi strumenti per collaborare e creare. Allo stesso tempo, gli sviluppatori utilizzano i nostri modelli e la nostra infrastruttura per creare nuove applicazioni di IA generativa, mentre startup e imprese in tutto il mondo stanno crescendo con i nostri strumenti IA“.
Come detto, ci saranno tre versioni: Gemini Ultra, il modello più avanzato e in grado di eseguire compiti altamente complessi, Gemini Pro che entrerà dentro in Bard e nel motore di ricerca e Gemini Nano che è il modello più efficiente in grado di lavorare anche negli smartphone a partire dalla famiglia Pixel .
“Gemini 1.0 è stato addestrato per riconoscere e comprendere testo, immagini, audio e altro contemporaneamente, e di conseguenza comprende meglio le sfumature tra le informazioni e può rispondere a domande relative ad argomenti complicati. Questo lo rende particolarmente utile per spiegare ragionamenti complessi, per esempio in matematica e fisica”, dicono da Mountain View.
Google ha annunciato che porterà Gemini anche su Pixel 8 Pro, il suo smartphone di punta, a partire dall’app registratore, Gboard e WhatsApp. A partire dal 2024, Gemini sarà disponibile su più prodotti e servizi Google tra cui ricerca, Chrome e videochat.
3 risposte