Gemini Robotics: Google realizza due modelli di intelligenza artificiale che hanno l’obiettivo di rivoluzionare i robot
Mani artificiali che giocano a tris, impegnate a mettere in ordine tessere per formare una parola, che eseguono ordini specifici come piegare un foglio con cura per creare un origami o spostare con delicatezza frutta fresca. Sono alcune dei video caricati su Deepmind, azienda che fa parte della galassia di Alphabet (e quindi della famiglia di Google). Si chiama Gemini Robotics, ed è un nuovo sistema di modelli basati su Gemini 2.0 di Google, realizzato con l’obiettivo di aumentare le capacità dei robot di nuova generazione. Come? “Consentono agli esperti di robotica di eseguire i propri programmi utilizzando le capacità di ragionamento di Gemini e ad una varietà di robot di eseguire una gamma di compiti nel mondo reale più ampia che mai”, spiegano da Google.
Il primo modello è Gemini Robotics è un modello avanzato di visione-linguaggio-azione per controllare direttamente i robot. Il secondo è Gemini Robotics-ER, un modello di linguaggio visivo con comprensione spaziale avanzata.
“Entrambi questi modelli consentono a una varietà di robot di svolgere una vasta gamma di compiti nel mondo reale – spiegano da Mountain View -. Stiamo collaborando con Apptronik per costruire la prossima generazione di robot umanoidi con Gemini 2.0. Stiamo anche lavorando con un numero selezionato di tester di fiducia per guidare il futuro di Gemini Robotics-ER”.
Per essere efficaci, i modelli di intelligenza artificiale pensati per la robotica hanno bisogno di tre qualità principali: devono adattarsi a situazioni diverse; devono essere interattivi, il che significa che possono capire e rispondere rapidamente alle istruzioni o ai cambiamenti nel loro ambiente; e devono saper manipolare gli oggetti nel modo più simile alle persone. Su questi tre punti fondamentali, Gemini Robotic, a detta di Google, offre “un passo in avanti sostanziale”.