Včeraj se je začelo svetovno prvenstvo v nogometu, ki ga letos gosti Rusija. Napovedi kažejo, da bo z več kot tremi milijardami gledalcev to najbolj množično spremljan športni dogodek v zgodovini. In ker je glavno vprašanje strastnih navijačev, kdo bo domov odnesel veliki pokal, so raziskovalci Andreas Groll, Christophe Ley, Gunther Schauberger in Hans Van Eetvelde s pomočjo strojnega učenja in analize velike količine podatkov napovedali letošnjega zmagovalca.

Kdo bo tokrat zmagal na svetovnem nogometnem prvenstvu?
Stave napovedujejo zmago Braziliji
En način, kako lahko z manjšo natančnostjo napovemo zmagovalca, je, da spremljamo pobiralce stav in njihove napovedi. Podjetja za športne stave uporabljajo profesionalna orodja in analitike za procesiranje podatkovnih baz, ki določijo stavčne kvote glede na morebitnega zmagovalca. Če združimo kvote več športnih stav, dobimo večjo verjetnost za končnega zmagovalca. Ta pristop kaže, da bo Brazilija jasni zmagovalec letošnjega svetovnega prvenstva z verjetnostjo 16,6 odstotka, sledili ji bosta Nemčija in Španija.

Končna lestvica svetovnega prvenstva na podlagi izračunov in strojnega učenja z verjetnostmi v odstotkih.
Raziskovalci so se napovedi lotili drugače
Ker pa stavčne kvote niso dovolj za natančno predvidevanje zmagovalca, so zgoraj omenjeni raziskovalci razvili tehnologijo strojnega učenja, ki se napovedi loti povsem drugače – z metodo naključnih gozdov in kombinacijo strojnega učenja ter konvencionalnih statistik. Metoda naključnih gozdov analizira veliko količino podatkov in nato vsak prihodnji rezultat določi na podlagi odločitvenega drevesa, kjer je vsak rezultat izračunan kot povprečje več naključnih predhodnih vej s pomočjo predhodnega strojnega učenja. Prednost te metode je, da ne naleti na problem prenasičenja, ki je značilen za navadna odločitvena drevesa. Prav tako določi, kateri faktorji so najpomembnejši pri izračunu končnega rezultata.
Raziskovalci so primerjali tri različne modele odločanja pri analiziranju rezultatov nogometnih tekem na podlagi vseh odigranih tekem na štirih preteklih svetovnih prvenstvih v obdobju od 2002 do 2014. Analizirali so vsako kombinacijo tekem, ki so jo reprezentance odigrale, in z rezultati sestavili najverjetnejši izid tekmovanja. V analizo so zajeli številne podatke, med drugim o gospodarski razvitosti in populaciji določene države, Fifino lestvico reprezentanc, povprečno starost posamične ekipe, število igralcev v posamezni reprezentanci, ki igrajo v Ligi prvakov, lestvico na podlagi stavčnih sistemov itd.

Potek končne šestnajsterice le na podlagi prihodnjih simulacij.
Kaj torej napoveduje računalnik s pomočjo strojnega učenja?
Rezultati raziskave se razlikujejo od ostalih napovedi. Glede zmagovalca letošnjega svetovnega prvenstva rezultati kažejo, da bo zlati pokal domov odnesla španska reprezentanca z verjetnostjo zmage 17,8 odstotka. Kar 73-odstotna verjetnost pa napoveduje Španiji mesto v četrtfinalu. Nemčiji napovedujejo 58-odstotno verjetnost, da bo prišla v četrtfinale. Če pa obe omenjeni reprezentanci prideta v četrtfinale, sistem napoveduje, da imata enako verjetnost za končno zmago. “Španija ima malce višjo verjetnost za zmago, saj se zaradi močnih nasprotnikov lahko zgodi, da Nemčija prej izpade iz šestnajsterice,” menijo raziskovalci.
Simulacija kaže tretji rezultat
Njihova tehnologija je ločeno simulirala celotno prvenstvo kar stotisočkrat in v tem primeru so rezultati drugačni. Tokrat bi Španija prišla le do polfinala, v finalu bi se pomerili Brazilija in Nemčija, reprezentanca Nemčije pa bi bila končna zmagovalka. Ker pa v tem načinu analize obstaja ogromno število permutacij, je po mnenju avtorjev ta izid skoraj neverjeten.
Mitja Godnič