Google lancia Lumiere: a differenza degli altre AI, quella di Big G usa un nuovo modello generativo capace di generare video realistici dalle foto
Come creare video dalle foto e da un semplice testo con istruzioni? Lumiere servirà proprio a questo e i primi risultati che si vedono in rete sono sorprendenti. A sviluppare il sistema di intelligenza artificiale ci ha pensato Google insieme al Weizmann Institute of Science e all’Università di Tel Aviv. Il nome Lumiere è un esplicito omaggio ai fratelli inventori del cinematografo. Ma è chiaro che, a parte l’omaggio agli albori del cinema, qui si tratta di un salto quantico rispetto a tutte le app che finora offrivano la possibilità di animare le foto.
Ancora non è possibile fare test (e non si sa quando lo sarà), Lumiere al momento non è aperto al pubblico ma è solo un progetto sperimentale di ricerca. Tuttavia le potenzialità si possono già vedere (un esempio il video qui sotto): la qualità con cui il software riesce a ricreare lo spostamento dei soggetti all’interno del filmato è molto elevata e non presenta, come altri software, le imperfezioni dovute alla difficoltà di mantenere una certa coerenza nel rendere animate immagini statiche.
Per questo specifico aspetto Google ha sviluppato un’architettura chiamata Space-Time U-Net, una specie rete spazio-temporale che genera l’intera durata temporale di un video in una volta sola, creando di fatto un movimento più realistico e coerente. In questo una grossa mano arriva proprio dal motore di AI generativa che sceglie il movimento migliore dopo averne analizzati diversi, basandosi sul vasto database a cui hanno accesso i modelli di Big G rendendo un video armonico e credibile rispetto al contesto. Per dare un po’ di numeri (anche se le fonti non sono certe): Lumiere è stato addestrato su un set di dati di 30 milioni di video, insieme alle relative didascalie di testo, ed è in grado di generare 80 fotogrammi a 16 fps.
Insomma le potenzialità e le opportunità dei modelli di AI generativa non smettono di stupire e di scavare un solco rispetto a tutto quello che conoscevano, e non solo in ambito informatico e tecnologico. Google, come tutte altre aziende del mondo tech, sta puntando forte sull’intelligenza artificiale: il suo nuovo modello di AI Gemini, presentato sul finire del 2023, ha già trovato un primo partner commerciale, Samsung, i cui nuovi S24 sono alimentati dall’intelligenza artificiale di Big G. E, a quanto pare, non è finita qui.
2 risposte