Neurónová Sieť Sa Naučila Generovať Videá Na Základe Popisu - Alternatívny Pohľad

Neurónová Sieť Sa Naučila Generovať Videá Na Základe Popisu - Alternatívny Pohľad
Neurónová Sieť Sa Naučila Generovať Videá Na Základe Popisu - Alternatívny Pohľad

Video: Neurónová Sieť Sa Naučila Generovať Videá Na Základe Popisu - Alternatívny Pohľad

Video: Neurónová Sieť Sa Naučila Generovať Videá Na Základe Popisu - Alternatívny Pohľad
Video: Hackeri vs. obrancovia - Jana Uramová, Miroslav Kohútik, Branislav Kramár, Žilinská univerzita 2024, Septembra
Anonim

Umelá inteligencia vytvára skriptované videá - zatiaľ krátke a rozmazané, ale jedného dňa nahradí celé filmové štúdio.

Neurónové siete sú už dosť dobre (av mnohých prípadoch lepšie ako ľudia) v rozpoznávaní vzorov na obrázku a sú schopné všeobecne opísať celé scény. Generatívne neurónové siete vykonávajú spätnú transformáciu a môžu vytvárať obraz na základe svojho opisu alebo predpovedať ďalší rámec na základe predchádzajúcich.

Belgickí vývojári zašli ešte ďalej a spojili tieto schopnosti do jedného systému, ktorý vytvára videá „z ničoho“na základe ich vlastných skúseností so strojovým učením a textom skriptov. Tinne Tuytelaars o tom hovorila na stretnutí Asociácie pre rozvoj umelej inteligencie (AAAI) v USA.

Neurónová sieť funguje v dvoch fázach - podľa Tinne, akoby napodobňovala tvorivý proces človeka: v prvej fáze sa vytvorí rozmazaná, približná „skica“každého snímku, po ktorej sa špecifikujú a pridávajú podrobnosti. Jednou z dôležitých častí takéhoto systému je diskriminačná neurónová sieť, ktorá porovnáva výsledok s „reálnymi“videami vhodnými pre daný scenár a umožňuje vám posúdiť jeho kvalitu a zlepšiť prácu generatívnej časti systému.

Neurónová sieť bola vyškolená na 10 scénach („golf na tráve“, „kitesurfing v mori“atď.) A naučila sa navzájom oddeľovať akcie a okolnosti a mohla ich tiež ľubovoľným spôsobom kombinovať, pričom vytvárala videá, napríklad o „Golf v bazéne“:

Image
Image

alebo „plachtenie na snehu“:

Image
Image

Propagačné video:

Kvalita takýchto animácií samozrejme nie je ani zďaleka prijateľná: „videá“trvajúce približne sekundu pozostávajú iba z 32 snímok s rozmermi 64 x 64 pixlov.

Ale s rovnakou istotou je možné zaručiť, že sa tieto čísla rýchlo zlepšia, pretože až donedávna sa kino mohlo pochváliť iba blátivým, šklbajúcim a nemým obrazom. Ak sa takáto neurónová sieť dá urobiť skutočne rýchlo a efektívne, Hollywood sa môže skončiť: bude stačiť vziať scenár a film bude pripravený. Táto príležitosť bude užitočná pri generovaní veľkých súborov na nácvik iných neurónových sietí a pri vytváraní nových algoritmov na kompresiu a prenos streamovaného videa.

Sergey Vasiliev