Umelá Inteligencia Sa Začala Učiť 10-krát Rýchlejšie A Efektívnejšie - Alternatívny Pohľad

Umelá Inteligencia Sa Začala Učiť 10-krát Rýchlejšie A Efektívnejšie - Alternatívny Pohľad
Umelá Inteligencia Sa Začala Učiť 10-krát Rýchlejšie A Efektívnejšie - Alternatívny Pohľad

Video: Umelá Inteligencia Sa Začala Učiť 10-krát Rýchlejšie A Efektívnejšie - Alternatívny Pohľad

Video: Umelá Inteligencia Sa Začala Učiť 10-krát Rýchlejšie A Efektívnejšie - Alternatívny Pohľad
Video: Umelá inteligencia | Ako človek prehral s počítačom 2024, Marec
Anonim

Divízia umelej inteligencie spoločnosti Google oznámila vytvorenie novej metódy pre výcvik neurónových sietí, ktorá kombinuje použitie pokročilých algoritmov a starých videohier. Staré vzdelávacie hry Atari sa používajú ako vzdelávacie prostredie.

Vývojári spoločnosti DeepMind (pripomínajú, že títo ľudia vytvorili neurónovú sieť AlphaGo, ktorá opakovane porazila najlepších hráčov v logickej hre go) veria, že stroje sa môžu učiť rovnakým spôsobom ako ľudia. Pomocou výcvikového systému DMLab-30, založeného na streleckých zbraniach Quake III a arkádových hrách Atari (používa sa 57 rôznych hier), vyvinuli inžinieri nový algoritmus strojového učenia IMPALA (Importance Weighted Actor-Learner Architectures). Umožňuje jednotlivým častiam naučiť sa vykonávať niekoľko úloh naraz a potom si medzi sebou vymieňať vedomosti.

Image
Image

Nový systém bol v mnohých ohľadoch založený na staršom architektonickom systéme asynchrónnych aktérov kritických agentov (A3C), v ktorom jednotliví agenti skúmajú prostredie, potom je proces pozastavený a vymieňajú si vedomosti s ústrednou zložkou „študent“. Pokiaľ ide o IMPALA, môže mať viac agentov a samotný proces výučby prebieha trochu inak. V ňom agenti posielajú informácie dvom „študentom“naraz, ktorí si potom navzájom vymieňajú údaje. Okrem toho, ak v A3C je výpočet gradientu stratovej funkcie (inými slovami, rozdiel medzi predpokladanou a získanou hodnotou parametra) robený samotnými agentmi, ktorí posielajú informácie do centrálneho jadra, potom v systéme IMPALA túto úlohu vykonávajú „študenti“.

Príklad osoby, ktorá sa hrá v hre:

Takto rieši systém IMPALA rovnakú úlohu:

Jednou z hlavných výziev pri vývoji AI je čas a potreba vysokého výpočtového výkonu. Aj keď sú stroje autonómne, potrebujú pravidlá, ktoré môžu vo svojich vlastných pokusoch dodržiavať a nájsť spôsoby, ako vyriešiť problémy. Pretože nemôžeme stavať len roboty a nechať ich učiť sa, vývojári používajú simulácie a techniky hĺbkového učenia.

Aby sa moderné neurónové siete mohli niečo naučiť, musia spracovať obrovské množstvo informácií, v tomto prípade miliardy rámcov. A čím rýchlejšie to dokážu, tým menej času sa bude učiť.

Propagačné video:

S dostatočným počtom procesorov DeepMind hovorí, že IMPALA dosahuje 250 000 snímok za sekundu alebo 21 miliárd snímok za deň. Podľa The Next Web je to absolútny záznam pre úlohy tohto druhu. Vývojári sami komentujú, že ich AI systém zvláda túto úlohu lepšie ako podobné stroje a ľudia.

V budúcnosti môžu byť podobné algoritmy AI použité v robotike. Optimalizáciou systémov strojového učenia sa roboti rýchlejšie prispôsobia svojmu prostrediu a efektívnejšie pracujú.

Nikolay Khizhnyak