TO ANIMIRANO MONA LIZO JE USTVARIL AI IN TO JE GROZLJIVO

Send

Enigmatičen, naslikan nasmeh "Mona Lise" je znan po vsem svetu, toda tisti znameniti obraz je pred kratkim pokazal osupljivo novo paleto izrazov, vljudnost umetne inteligence (AI).

V videoposnetku, ki je bil 21. maja objavljen na YouTubu, trije video posnetki prikazujejo neupravičene primere Mona Lise, ko premika ustnice in obrača glavo. Ustvarila jo je konvolucionarna nevronska mreža - vrsta AI, ki obdeluje informacije toliko kot človeški možgani, da analizira in obdeluje slike.

Raziskovalci so algoritem usposobili, da so razumeli splošne oblike obraznih lastnosti in kako se obnašajo med seboj, nato pa te podatke uporabili za fotografije. Rezultat je bilo realistično video zaporedje novih izrazov obraza iz enega samega kadra.

Za videoposnetke Mona Lisa se je AI "naučil" gibanja obraza iz nabora podatkov treh človeških subjektov, pri čemer je ustvaril tri zelo različne animacije. Medtem ko je bil vsak od treh posnetkov še vedno prepoznaven kot Mona Lisa, so različice videza in vedenja vadbenih modelov dajale različne osebnosti "živim portretom", Egor Zakharov, inženir s Skolkovega inštituta za znanost in tehnologijo, in Samsung AI Center (oba se nahajata v Moskvi), je pojasnjeno v videoposnetku.

Zakharov in njegovi sodelavci so ustvarili tudi animacije iz fotografij kulturnih ikon 20. stoletja, kot so Albert Einstein, Marilyn Monroe in Salvador Dali. Raziskovalci so svoje ugotovitve, ki niso bili strokovno pregledani, opisali v študiji, objavljeni na spletu 20. maja v reviji za tisk arXiv.

Znani obrazi prevzemajo neznane izraze. (Slika: E. Zakharov et al.)

Izdelava originalnih videoposnetkov, kot so ti, znani kot deepfakes, ni enostavna. Človeške glave so geometrijsko zapletene in zelo dinamične; 3D modeli glav imajo "desetine milijonov parametrov", so zapisali avtorji študije.

Poleg tega je človeški vidni sistem zelo dober pri ugotavljanju "celo manjših napak" v 3D modeliranih človeških glavah, navaja študija. Videti nekaj, kar je videti skoraj človeško - vendar ne čisto -, sproži občutek globoke nelagodnosti, znane kot učinek nenavadne doline.

AI je že pred tem dokazal, da je mogoče ustvariti prepričljive globoke utripe, vendar je za to potreben več zornih kotov. Za novo študijo so inženirji AI predstavili zelo velik nabor referenčnih videov, ki prikazujejo človeške obraze v akciji. Znanstveniki so vzpostavili mejnike obraza, ki bi veljale za kateri koli obraz, da bi nevronsko mrežo naučili, kako se obrazi obnašajo na splošno.

Nato so usposobili AI za uporabo referenčnih izrazov za preslikavo gibanja lastnosti vira. To je omogočilo AI, da ustvari globinsko ploščico, tudi če ima samo eno sliko, s katero lahko deluje, so sporočili raziskovalci.

In več izvornih slik je v končni animaciji prineslo še podrobnejši rezultat. Znanstveniki so zapisali, da so video posnetki, ustvarjeni iz 32 slik, ne le ene, dosegli "popoln realizem".

Send