ByteDance presenta OmniHuman-1, il modello IA per la generazione di video iper-realistici

ByteDance, l’azienda dietro TikTok, ha presentato OmniHuman-1, un modello di intelligenza artificiale in grado di trasformare foto e file audio in video estremamente realistici, dimostrando i rapidi progressi della Cina nel campo dell’IA. Secondo i ricercatori di ByteDance, questo modello multimodale produce video di persone che parlano, cantano e si muovono con un livello di realismo che supera nettamente le attuali tecnologie di sintesi video umana basata su IA.

Progressi nella generazione video basata sull’IA

La sintesi di immagini, video e audio basata sull’IA, spesso associata ai deepfake, è al centro di discussioni riguardanti sia le applicazioni nell’intrattenimento che i rischi di frode. La divisione IA di ByteDance si è affermata come leader in questo settore, con la sua app Doubao, che è diventata il prodotto IA più popolare tra i consumatori in Cina.

Sebbene OmniHuman-1 non sia ancora disponibile per il pubblico, alcuni video di esempio sono diventati virali, mostrando le sue capacità impressionanti. Una delle demo più sorprendenti presenta un clip di 23 secondi di Albert Einstein, intento a pronunciare un discorso. Kyle Wiggers di TechCrunch ha definito il risultato “sorprendentemente realistico”, suggerendo che potrebbe trattarsi dei deepfake più avanzati mai realizzati.

>>>000505 for Whitlock DNFT-PRG Tadiran

Il lancio di OmniHuman-1 avviene in un momento in cui le politiche degli Stati Uniti mirano a limitare lo sviluppo dell’IA in Cina, ma le aziende cinesi continuano a compiere progressi significativi nelle tecnologie di generazione video. La piattaforma Jimeng AI di ByteDance, che integra i modelli PixelDance e Seaweed, sta ricevendo aggiornamenti frequenti, migliorando la capacità di produrre video coerenti e altamente realistici.

Anche altre aziende tecnologiche cinesi stanno investendo in questo settore, tra cui Kuaishou Technology con la sua app Kling, oltre a diverse startup IA come Zhipu AI, Shengshu Tech e MiniMax.

Grazie a innovazioni come OmniHuman-1ByteDance si posiziona come leader nella generazione di video basata sull’IA, potenzialmente in competizione con strumenti come Sora di OpenAI, reso disponibile a un pubblico più ampio nel dicembre 2024. Con il rapido sviluppo di questa tecnologia, le sue applicazioni—dall’intrattenimento ai media digitali fino alla creazione di contenuti—dovrebbero espandersi in modo significativo.

Articolo creato 629

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Articoli correlati

Inizia a scrivere il termine ricerca qua sopra e premi invio per iniziare la ricerca. Premi ESC per annullare.

Torna in alto