“Un agente che può andare sul web per eseguire attività per te”: ecco Operator, il nuovo strumento di OpenAI
È arrivato nella serata di ieri, 23 gennaio, l’annuncio ufficiale. Con un post sul suo blog OpenAI ha infatti reso noto l’avvio di una fase di Research Preview del progetto relativo al suo Operator.
Come affermato dalla stessa OpenAI, si tratta di agente che può andare sul web per eseguire attività per te. Alla base del funzionamento, il modello Computer-Using Agent (CUA), che combina le capacità Vision di GPT-4o e la tecnica dell’Advanced Reasoning con Reinforcement Learning.
Come funziona Operator di OpenAI?
Operator è in grado di interagire con le interfacce utente grafiche (GUI), i pulsanti, i menu e i campi di testo con cui normalmente noi interagiamo sullo schermo, senza dover utilizzare API specifiche del sistema operativo o del web.
Stando a quanto descritto da OpenAI, i test sono ottimi. WebVoyager ha fatto segnare un 87% di operazioni eseguite con successo da Operator per quel che riguarda i task basati sul Web. Per i task che invece utilizzano il PC nel suo complesso, OSWorld segna un 38,1% di operazioni eseguite con successo.
Se si tratta di operazioni più complesse o di inserimento di credenziali o dati sensibili, Operator può lasciare il comando all’utente. Per quel che riguarda operazioni come l’invio di e-mail, inoltre, l’IA è progettata per chiedere una conferma finale all’utente.
Ad oggi, l’accesso in Research Preview è riservato agli utenti statunitensi iscritti a ChatGPT Pro. In futuro Operator arriverà anche per gli utenti ChatGPT Plus, Team ed Enterprise.