AI Sa Nezávisle Naučil Hrať šach Na Nadľudskej úrovni Za Deň - Alternatívny Pohľad

AI Sa Nezávisle Naučil Hrať šach Na Nadľudskej úrovni Za Deň - Alternatívny Pohľad
AI Sa Nezávisle Naučil Hrať šach Na Nadľudskej úrovni Za Deň - Alternatívny Pohľad

Video: AI Sa Nezávisle Naučil Hrať šach Na Nadľudskej úrovni Za Deň - Alternatívny Pohľad

Video: AI Sa Nezávisle Naučil Hrať šach Na Nadľudskej úrovni Za Deň - Alternatívny Pohľad
Video: Peter Paleček - "Základné návyky" 2024, Apríl
Anonim

Algoritmus AlphaZero bez učiteľa človeka zvládol šachy a hru shogi za 24 hodín, takže porazil ďalšie programy šampiónov, ktoré predtým bezpodmienečne porazili ľudí.

Deep Mind, spoločnosť vyvíjajúca algoritmy pre umelú inteligenciu (AI), zverejnila údaje o výsledkoch preškolenia algoritmu AlphaGo na hranie šachu a shogi. V minulosti sa AlphaGo podarilo poraziť majstrov sveta v hre go. Umelá inteligencia dokázala zvládnuť nové hry ešte rýchlejšie. Zodpovedajúca práca je zverejnená na predtlačovom serveri Cornell University.

AlphaZero použil metódu výučby posilnenia. Je to podtyp hlbokého strojového učenia, ktorý nepoužíva učiteľa človeka, ale výlučne hry medzi dvoma AI. Aj keď na začiatku obidve AI hrajú veľmi slabo, vďaka svojej vysokej rýchlosti (v porovnaní s ľudským učiteľom) môžu hrať v krátkom časovom období veľké množstvo hier a vybrať si osvedčené ťahy a ich sekvencie v určitých pozíciách na hracej ploche, čo dáva schopnosť algoritmov veľmi rýchlo zvyšovať svoju úroveň.

V tomto prípade AlphaZero dosiahla úroveň hry vyššiu ako ktorýkoľvek ľudský hráč za pouhých 24 hodín. Potom sa jej umožnilo hrať s Stockfishom, najlepším šachovým hráčom, ktorý je k dispozícii, a Elmo, najlepším hráčom shogi (vysoko upravený šach v ranom stredovekom Japonsku).

Napriek veľmi krátkemu tréningovému obdobiu, AlphaZero porazilo Stockfish 28 krát a remizovalo 72 krát. Podarilo sa jej vyhrať 90 krát Elmo, prehra 8-krát a remíza 2-krát. Toto sú mimoriadne vysoké výsledky. Šach aj šógi sa veľmi líšia od cesty, pre ktorú bol AlphaGo pôvodne vytvorený, ako aj od seba navzájom. Napríklad „japonské šachy“znamenajú mimoriadne exotické možnosti, napríklad hranie ktoréhokoľvek z „jedlých“kúskov nepriateľa. Víťazstvo algoritmu vytvoreného pre Go iba hrou s úplne identickým algoritmom z jeho vlastnej znamená, že učiteľ človeka môže dosiahnuť

IVAN ORTEGA