Prva zmaga umetne inteligence nad profesionalnim igralcem StarCraft II

DeepMind, podjetje v Googlovi lasti, je znano ime na področju razvoja umetne inteligence, sedaj pa jim je uspelo postaviti nov mejnik: premagali so profesionalnega igralca igre StarCraft II.

DeepMind je s svojo umetno inteligenco AlphaZero v preteklosti že premagal svetovnega prvaka v namizni igri Go, ravno tako jim je uspela zmaga nad do takrat nepremagljivim šahovskim programom Stockfish. Tedaj so razglasili, da jim bo uspelo izmojstriti svojo umetno inteligenco za igro StarCraft v dveh do treh letih, in očitno se niso motili.

Računalniki so že davno izmojstrili šah – leta 1997 je svetovni prvak Garry Kasparov izgubil proti računalniku Deep Blue

Kako jim je uspelo?

Tekmovanje je potekalo decembra lani na sedežu podjetja DeepMind v Londonu, kjer sta profesionalna igralca, znana kot TLO in MaNa, odigrala vsak pet tekem proti novi različici AlphaZero, poimenovani AlphaStar. AlphaStar je brez večjih težav premagal oba igralca z rezultatom 5-0 za končni rezultat 10-0.

Po prvem krogu tekem se je povratna tekma zgodila 24. januarja. V njej je igralcu MaNa uspel preboj in je premagal AlphaStar. Prvi krog tekem je imel nekaj omejitev: AlphaStar je bil omejen na nižje število ukazov od svojih človeških tekmecev, je pa imel prednost pri tem, da je imel pregled nad celotnim zemljevidom virtualne arene, v kateri je potekala tekma.

Za slednje so raziskovalci trdili, da ne predstavlja bistvene prednosti, saj naj bi se AlphaStar naenkrat osredotočal na eno samo področje (tako kot človeški igralci). Vendar je zanimivo, da je v tekmi, ki jo je umetna inteligenca izgubila, AlphaStar igral z omejenim pogledom, torej brez pregleda celotnega področja igre.

StarCraft je predstavljal drugačen izziv od namiznih iger, kot sta Go in šah

Pri obeh namiznih igrah je igralna površina nemudoma vidna obema igralcema, igra pa poteka izmenično s premikom ene same figure v potezi. StarCraft se razlikuje po tem, da morata območje igre igralca najprej “odkriti” z izvidniškimi enotami, igra pa poteka v realnem času z ogromnim številom enot, ki jih je potrebno nadzirati.

“Trening” umetne inteligence je potekal tako, da je AlphaStar večkrat naenkrat igral igre proti samemu sebi in se iz tega s pomočjo večnivojskega algoritma učil možnih strategij ter iskal optimalne. Skupno je odigral za približno 200 let tekem proti samemu sebi.

Tako je umetna inteligenca postavila nov mejnik, raziskovalci pa imajo še vedno enak cilj: stvaritev prave umetne inteilgence, ki bo uporabna v vseh scenarijih.

Author: Alen Vrević

Share This Post On