Cerca
Close this search box.
Cerca
Close this search box.
0%
Premi per ascoltare

Dal testo al video con un click: OpenAI lancia Sora

Prosegue il lavoro di OpenAI, che lancia Sora: l’intelligenza artificiale in grado di generare video fino a 60 secondi da un semplice comando testuale

Da un prompt testuale a un video. Pochi click e il risultato è sorprendente (anche se ancora non è aperto a tutti, nemmeno come prova). Si tratta dell’ultimo arrivato in fatto di AI. Si chiama Sora, è realizzato da Open AI (la stessa di ChatGPT) e permette di creare filmati fornendo al chatbot solo indicazioni testuali.

Un esempio? Il video sotto è stato creando con questo prompt:

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

Traduzione: “Una donna elegante cammina lungo una strada di Tokyo piena di neon caldi e luminosi e di segnaletica animata della città. Indossa una giacca di pelle nera, un lungo vestito rosso e stivali neri e porta una borsa nera. Indossa occhiali da sole e rossetto rosso. Cammina con sicurezza e disinvoltura. La strada è umida e riflettente, creando un effetto specchio delle luci colorate. Molti pedoni passeggiano”.

L’effetto è realistico, i movimenti naturali e il contesto creato è armonico e coerente con quanto richiesto nel comando testuale. È per questo che non esiste, al momento, una versione aperta al pubblico. OpenAI teme infatti i video fake che potrebbero scaturire. Siamo alla vigilia di importanti campagne elettorali in giro per il mondo, su tutte le elezioni Europee e le presidenziali USA. L’azienda non ha ancora trovato un modo per proteggere eventuali manipolazioni. In questa direzione va la volontà di voler coinvolgere politici, educatori e artisti per “comprendere le preoccupazioni e identificare casi d’uso positivi per questa nuova tecnologia”.

“Sora – si legge nel sito ufficiale che presenta il progetto di OpenAI – è in grado di generare scene complesse con più personaggi, tipi specifici di movimento e dettagli accurati del soggetto e dello sfondo. Il modello comprende non solo ciò che l’utente ha chiesto nel prompt, ma anche come queste cose esistono nel mondo fisico”.

Un altro esempio.

Prompt: A drone camera circles around a beautiful historic church built on a rocky outcropping along the Amalfi Coast, the view showcases historic and magnificent architectural details and tiered pathways and patios, waves are seen crashing against the rocks below as the view overlooks the horizon of the coastal waters and hilly landscapes of the Amalfi Coast Italy, several distant people are seen walking and enjoying vistas on patios of the dramatic ocean views, the warm glow of the afternoon sun creates a magical and romantic feeling to the scene, the view is stunning captured with beautiful photography.

Traduzione: Un drone gira intorno a una bellissima chiesa storica costruita su uno sperone roccioso lungo la Costiera Amalfitana, la vista mostra dettagli architettonici storici e magnifici, percorsi e cortili a più livelli, si vedono onde che si infrangono contro le rocce sottostanti mentre la vista si affaccia sull’orizzonte della costa acque e paesaggi collinari della Costiera Amalfitana Italia, diverse persone lontane vengono viste passeggiare e godersi panorami sui cortili delle spettacolari viste sull’oceano, la calda luce del sole pomeridiano crea una sensazione magica e romantica alla scena, la vista è straordinaria catturata con bella fotografia.

Per superare i problemi di sicurezza, OpenAI si dice pronta a utilizzare delle etichette. Su questo punto l’azienda sta lavorando il consorzio C2pa, di cui fanno parte la stessa OpenAI ma anche la Bbc e il New York Times. L’idea è inserire metadati aggiuntivi che evidenzino l’eventuale creazione di un file tramite l’AI di Sora e bloccarne la diffusione online, qualora vengano violate le policy.

Anche se la stessa OpenAI mette le mani avanti e avverte: “Nonostante ricerche e test approfonditi, non siamo in grado di prevedere tutti i modi positivi in ​​cui le persone utilizzeranno la nostra tecnologia, né come ne abuseranno”

OpenAI lancia Sora

Sora non è il primo modello del genere ma è l’unico a poter generare un file lungo fino a 60 secondi. È inoltre in grado di simulare la presenza di più videocamere. Il che garantisce che i soggetti rimangano gli stessi anche quando escono temporaneamente dalla vista. Solo qualche giorno fa, Google aveva lanciato Lumiere (ne avevamo parlato qui), strumento molto simile che però crea filmati partendo da immagini caricate dall’utente.

Ultimi articoli

Un podcast sull’economia civile, dai francescani ai giorni nostri

Nomadi digitali: in Europa le migliori locations

Breve storia della digitalizzazione della Pubblica Amministrazione

Calendario eventi

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Skip to content