torstai 1. kesäkuuta 2017

Peliesitys – miten sen tasoa voi arvioida?


Veikkauksen noin vuosi sitten järjestämässä vetoseminaarissa Helsingin Casinolla yhtiön kertoimenlaskija Teemu Eirtovaara kertoi paneelikeskustelussa parhaaksi kollegalta saamaksi opikseen sen, että joukkue on juuri niin hyvä kuin sen peliesitykset kertovat. Ei materiaalin taso, ei toteutuneet tulokset, vaan nimenomaan peliesitykset. Eirtovaaran puheenvuoro löytyy Youtubesta.

Olen täysin samaa mieltä Eirtovaaran kanssa. Peliesitykset ovat omassa työssäni ylivoimaisesti tärkein mittari joukkueiden rankingien ja sitä kautta otteluiden todennäköisyysarvioiden määrittämisessä. Peliesitysten arvioinnista ei ole mielestäni kirjoitettu ainakaan suomeksi missään, eikä niistä ole käyty yleisillä keskustelupalstoilla kunnon keskustelua.

Kirjoitin viime keväänä blogitekstin Leicesterin tasosta maaliodotusarvojen näkökulmasta. Nimenomaan katsotuista peleistä itse tilastoitujen numeroiden pohjalta. Sen jatkeeksi haluan nyt kirjoittaa peliesityksistä.

Pohjana maaliodotusarvot

Tavoitteeni on arvioida joukkueiden suorituksia mahdollisimman yksinkertaisesti ja jatkokäyttökelpoisesti. Joskus noin 5-10 vuotta sitten annoin joukkueille numeraalisen arvosanan otteluiden peliesityksistä pitkälti Stetson-Harrison-metodilla, mihin vaikutti luettu otteluraportti/valmentajan kommentit, ottelun tilastot ja kenties highlight-kooste. Niiden pohjalta muodostin käsityksen otteluiden ”reilusta lopputuloksesta” sekä joukkueiden suoritustasosta. Siirryttyäni otteluiden maaliodotusarvojen tilastointiin sain kuitenkin selkeän tartuntapinnan peliesitysten numeraaliseen arviointiin.

Viime keväänä kirjoittamani Leicester-pätkä sisälsi hieman pohjatietoa maaliodotusarvoista, ja suosittelen lukemaan sen, mikäli et ole vielä sitä tähän mennessä lukenut. Maaliodotusarvoista on materiaalia kuitenkin paljon etenkin englanniksi, ja Suomessa asiasta on pitänyt ääntä etenkin Rajainmäen Kari. Kari piti aiheesta erittäin pätevän esitelmän viime kesänä Ylikerroin.comin vedonlyöntiklinikalla/kesätapaamisessa.

Lyhyesti siis, ottelusta pyritään muodostamaan objektiivinen kuva joukkueiden luomasta maaliuhasta. Jotkut mallintavat sitä Optan datasta, jotkut katsovat pelit itse. Itse kuulun jälkimmäiseen kategoriaan. Tässä on esimerkki yhden tämän kauden Valioliigaottelun muistiinpanoistani:


 Ottelu on 11.3.2017 pelattu Hull–Swansea.

Taulukoissa Koti- ja Vieras-merkintöjen alla olevalla rivillä numerot kuvaavat _suurin piirtein_ pelattuja minuutteja. Olen pakottanut kaavoissani ottelut kestämään tasan 90 minuuttia, joten näissä on pieniä heittoja todellisiin peliaikoihin. Eli tässä esimerkkipelissä ottelu on ollut tasatilanteessa noin 70 minuuttia, Hull on johtanut yhdellä maalilla 9 minuuttia ja kahdella tai useammalla maalilla 11 minuuttia.

Alemmilla riveillä numerot ovat pelin sen hetkisiä minuuttimääriä. Niiden vieressä oikealla puolella on pelitilanteen määritelmä omia tilastojani varten, esim. et = erikoistilanne, vi = vastaisku jne. Ne eivät ole tässä kohtaa merkityksellisiä. Niitä seuraa tilanteen arvioimani maaliodotusarvo.

Esimerkkinä olevassa Hull–Swansea-ottelussa Hull on luonut omien tilastojeni mukaan yhteensä maaliodotusarvoa 1,47, josta tasatilanteessa on luotu 0,86, yhden maalin johdossa 0,48 ja kahden tai sitä suuremman maalin johtoasemassa 0,13.
Swansean ottelussa luoma maaliodotusarvo omissa tilastoissani on 1,21, josta tasatilanteessa on luotu 0,91, maalin tappioasemassa 0,02 ja kahden tai sitä suuremman maalin tappioasemassa 0,28.

Perustaso ja ennakko-odotus

Oma joukkueiden tason analysointityö sekä otteluiden todennäköisyysarvioiden laskenta perustuu maaliodotusarvoihin, joiden esitysmuotona tykkään käyttää kolmea eri lukua: voitto/tappio-suhdetta (1) kuvaamaan joukkueen kokonaistasoa, yli 2,5 maalin prosenttilukua (2) kuvaamaan joukkueen kokonaismaalimäärää, ja kotietua (3) kuvaamaan kotiriippuvuutta. Tämä on puhtaasti tottumuskysymys.

Otetaan esimerkiksi Valioliigasta Hull, jonka arvioin tekevän sarjassa keskimäärin 0,90 maalia ja päästävän 1,57 maalia.

Käsittelen Hullia kyseisten maaliodotusten sijaan luvuilla 0,4 (1), 45 % (2) ja 1,12 (3). Luvut 0,4 ja 45 % tulevat Poisson-kaavan perustuvan laskurin kautta, kun siihen lyö maaliodotusarvoiksi 0,90-1,57. Jos Poisson-laskuri ei ole tuttu, niin tässä on yksi esimerkki. 
Maaliodotusarvoilla 0,90-1,57 saadaan 1X2-jakaumaksi n. 22–25–53 %, josta voitto/tappio-suhteeksi tulee n. 0,4 (22/53). Yli 2,5 maalin tuloksen todennäköisyys näillä maaliodotusarvoilla on puolestaan se noin 45 %.
Kotietua 1,12 käytän sitten otteluiden todennäköisyysarvioita laskiessa, ja niihin huomioin tietenkin molempien kyseessä olevien joukkueiden kotiedut. Hull-esimerkkitapauksen luku 1,12 tarkoittaa sitä, että arvioin Hullin otteluissa kotijoukkueiden tekevän 12 % enemmän maaleja ”puolueettomaan kenttään” verrattuna. Luku 1,12 tulee siis kaavasta

      Hullin otteluiden kotijoukkueiden maalit
–––––––––––––––––––––––––––––––––––––––
                               (Hullin otteluiden kaikki maalit / 2)

Hyvä, eli nyt kun lähden arvioimaan joukkueen peliesityksen tasoa jossain yhdessä ottelussa, otan ensin huomioon ennakko-odotuksen. Tarkoitan siis joukkueen sen hetken rankingia/tasoa.
Hull–Swansea-esimerkkiottelussa joukkueiden rankingini ennen ottelua ovat voineet olla esimerkiksi Hull 0,4 45 % 1,12 ja Swansea 0,5 44 % 1,11, ja näillä rankingeilla ottelun maaliodotusarvoni ovat n. 1,23–1,12, mitkä tarkoittavat todennäköisyysarvioina esim. 38–30–32 %, yli-alle 2,5 maalia 42-58 %. Luvut tulevat ulos kertoimenlaskentatyökalustani, jonka perkaus sen tarkemmin ei kuulu tähän aiheeseen.
Jutun juju on kuitenkin se, että ennakko-odotuksessa huomioidaan sekä oma oletettu perustaso että ennen kaikkea vastustajan taso. 


Toteutunut peliesitys

Lähden siis siitä, että arvioimillani perustasoillaan suorittaessaan Hull ja Swansea tuottavat Hullin kotona pelatessaan maaliodotusarvot 1,23–1,12.

Katson ottelun ja teen muistiinpanoja pelitilanteiden maaliodotusarvoista aiemmin esitettyyn tapaan. Saan siis tästä ottelusta kokonaismaaliodotusarvoiksi 1,47–1,21. Huomaan, että peli oli tasatilanteessa valtaosan (70/90 minuuttia) peliajasta, ja sinä aikana maaliodotusarvot olivat 0,86–0,91. Hull oli tässä tapauksessa onnekkaampi tehdessään avausmaalin, ja johtoasemassa joukkue pääsi hyviin tilanteisiin Swansean joutuessa nostamaan omia riskitasojaan. Avausmaalin jälkeen pelin kokonaismaalintekointensiteetti nousi myös selvästi 0–0-tilanteeseen nähden.

En palkitse peliesitystä arvioidessani Hullia täysimittaisesti siitä, että he olivat tällä kertaa onnekkaampia tehdessään ottelun avausmaalin. En siis käytä peliesityksiä arvioidessani ottelun kokonaismaaliodotusarvojani 1,47–1,21, vaan painotan tasaista pelin kuvaa pitkään kestäneessä tasatilanteessa. Jos maalintekointensiteetti olisi jatkunut samanlaisena läpi ottelun kuin se oli 0–0-tilanteessa, olisivat maaliodotusarvot voineet olla n. 1,11 (0,86/70*90) – 1,17 (0,91/70*90).

Tässä kohtaa täytyy käyttää sitten omaa harkintaa, miten paljon painottaa mitäkin ottelun tilannetta. Swansean koko pelin maaliodotus oli omissa tilastoissani siis 1,21, ja tasatilanteen mukaan 90 minuutin korjauksella 1,17. Swansean kohdalla 1,20 on siis hyvä pyöreä arvio tästä pelistä.
Hullin kohdalla johtoasema tuotti heille ison edun. Koko pelin maaliodotukseni Hullille oli siis 1,47, ja tasatilanteen mukainen luku 1,11. Käytän peliesitystä arvioidessani Hullin maaliodotuksena jotain lukua näiden välimaastosta, mikä voisi olla esim. 1,20 tai 1,25. Päädytään tässä kohtaa esimerkiksi 1,25:een.

Eli, olen arvioinut ensin ottelun maalipaikat numeraalisessa muodossa saaden maaliodotusarvot ja painottanut niitä sitten eri pelitilanteet huomioiden. Tämä painotus on minusta erittäin tärkeä osa-alue, sillä välillä otteluiden kokonaismaaliodotusarvot muodostuvat todella harhaanjohtaviksi pelin todellisesta kuvasta. Jalkapallossahan pelataan ensisijaisesti vain pisteistä. Kolme pistettä saa yhtä lailla maalin kuin viiden maalin voitosta.
Jotkut joukkueet ovat suvereeneja tasatilanteessa ja esim. 1–0-johtomaalin syntyessä 40 minuutin kohdalla maaliodotusarvot voivat olla 1,10–0,05. 2–0-maali voi syntyä toisen jakson alussa 50 minuutin kohdalla ja maaliodotusarvot olla siinä kohtaa 1,40–0,20. Loppupelistä johtoasemassa oleva joukkue säästelee energiaa tulevaan europeliin ja vaihtaa esim. kaksi avainpelaajaa pois tunnin kohdalla. Vieraat tekevät 2–1-kavennusmaalin 75 minuutin kohdalla jolloin maaliodotusarvot voivat olla 1,50–0,65, ja lopussa vieraat saavat vielä pienen kirin päälle isäntien tyytyessä johdon suojeluun. Pelin kokonaismaaliodotusarvoiksi voi muodostua esim. 1,60–0,80, vaikka voittajasta ei ole ollut todellisuudessa juuri mitään epäselvyyttä.

Takaisin Hull–Swansea-otteluun. Olen arvioinut ottelun kuvan mukaisiksi maaliodotusarvoiksi siis 1,25–1,20. Avaan sen jälkeen oman kertoimenlaskentatyökaluni, jota käytin ennen ottelua maaliodotusarvojen 1,23–1,12 muodostamiseen. Sen arvion sain siis rankingeilla Hull 0,4 45 % 1,12 ja Swansea 0,5 44 % 1,11. Seuraavaksi muokkaan joukkueiden tunnuslukuja mahdollisimman vähän kumpaakin, jotta saan kertoimenlaskentatyökalustani ulos maaliodotusarvot 1,25–1,20. Tässä tapauksessa se toteutuu esimerkiksi tunnusluvuilla Hull 0,4 46 % 1,12 ja Swansea 0,55 46 % 1,11, jotka ovat minun arvioni joukkueiden tämän ottelun peliesityksistä. Kun vertaan näitä ranking-tunnuslukuja ennakko-odotuksiini joukkueiden sen hetken perussuoritustasosta (Hull 0,4 45 % 1,12 ja Swansea 0,5 44 % 1,11), teen johtopäätöksen, että molemmat pelasivat hieman odottamaani runsasmaalisemmin, ja Swansea pelasi hieman odottamaani paremmin. 

Listaan tässä kohtaa joukkueiden peliesitys-tunnusluvut ylös Exceliin, josta löytyy allekkain samat luvut kauden kaikista muista otteluista. Hullin kohdalla litania näyttää tämän pelin jälkeen omassa tiedostossani tältä:

Peliesitys

v/t
over
kotietu
0,3
41 %
1,02
0,5
45 %
1,06
0,5
38 %
1,04
0,7
34 %
1,04
0,4
51 %
1,03
0,15
28 %
1,17
0,35
36 %
1,06
0,2
44 %
1,20
0,15
38 %
1,00
0,3
35 %
1,10
0,3
51 %
1,08
0,3
61 %
1,09
0,3
31 %
1,05
0,2
27 %
1,14
0,4
59 %
1,15
0,4
52 %
1,10
0,5
47 %
1,04
0,3
49 %
1,09
0,4
39 %
1,09
0,55
40 %
1,02
0,4
49 %
1,09
0,5
38 %
1,09
0,7
35 %
1,09
0,6
38 %
1,09
0,5
48 %
1,09
0,6
48 %
1,20
0,55
39 %
1,10
0,4
46 %
1,12

Tuorein merkintä on listassa alimpana, ja ylimpänä on kauden ensimmäinen ottelu. Tämä numerotaulukko on minulle yksittäisistä mittareista ylivoimaisesti tärkein arvioidessani joukkueen tämän hetken perussuoritustasoa sekä pelin kokonaistason, maalimäärän että kotiriippuvuuden suhteen.

Miten peliesitykset korreloivat pisteisiin ja maalieroon muihin mittareihin verrattuna?

Miksi sitten painotan niin paljon peliesityksiä joukkueita arvioidessani, enkä esimerkiksi puhtaasti tilastoimiani maaliodotusarvoja tai yleisiä laukaisutilastoja? Syy on tässä:


Inspiraation taulukkoon sain tästä PenaltyKickStat'n julkaisusta, ja käytin samoja perusteita kuin kyseisen blogitekstin tutkimuksessa:

I decided to use the R value (=correl in Excel) to evaluate:
1.     the metric in question and points/goal difference for the same season (is there a link between the two?)
2.     the metric in y and y+1 (is the metric a repeatable skill?)
3.     the metric in y and pts / GD in y+1 (is it predictive?)

Luvut ovat siis Excelin KORRELAATIO-funktiosta. Luku 1,00 tarkoittaa täydellistä korrelaatiota ja 0,00 ei lainkaan korrelaatiota. Mittareista xG ero tarkoittaa itse tilastoimieni luotujen ja vastustajien luoman maaliodotuksen erotusta, xGR maaliodotusarvosuhdetta (oma luotu kokonaismaaliodotus/(oma + vastustajan luoma maaliodotus), TSR on yhtä kuin total shots ratio, eli kaikkien laukausten suhde, ja SOTR on maalia kohti suuntautuneiden laukausten suhde.

Luvut ovat kahdelta viimeisimmältä täydeltä Valioliigakaudelta, eli otoskoko on varsin pieni (n=17) tutkittaessa mittarin toistettavuutta ja ennustuskykyä. 
Molemmissa kategorioissa pisteet ja maaliero ovat huonoimpia mittareita. TSR pärjää hyvin SOTR:n kanssa, mutta xG:t sekä erotuksen että ration suhteen ovat parempia mittareita. Peliesitys on kuitenkin yksittäisistä mittareista paras sekä keskiarvon että mediaanin osalta. Alla on muutama pistekaavio eri mittareiden välisestä suhteesta peräkkäisillä kausilla (eli yllä olevan taulukon osasta 3).




                            

Loppukiteytys

Kiteytettynä, peliesitystä kannattaa pyrkiä arvioimaan mahdollisimman yksinkertaisesti ja omien menetelmien jatkokäyttöä silmällä pitäen. Kun ottelutapahtumista muodostaa jonkinlaisen kuvan, on sitä helpoin verrata omiin ennakko-odotuksiin (rankingiin) ja tutkia, millaisilla ennakko-odotuksilla (ranking-arvioilla) saisi ulos omista menetelmistään pelitapahtumia vastaavan tuloksen. Täten tulee huomioitua myös vastustajan taso, sillä on aivan eri asia voittaa ansaitusti vieraissa sarjakärki 2-0 kuin kotona sarjajumbo samanlaisilla lukemilla ja maalipaikkajakaumilla.

Jälkikirjoitus

Tämän tekstin kirjoittaminen oli mieluisin työhöni liittyvä projekti pitkään aikaan. Pääsin helposti flow-tilaan ja aika hurahti todella nopeasti. Tällaista työtä haluaisin enemmän tulevaisuudessa! Mikäli haluat antaa palautetta tai jatkaa keskustelua aiheesta, ota yhteyttä esim. Twitterissä tai sähköpostitse janne_hakulinen(at)hotmail(dot)com. Suhtaudun avoimesti ja olen vapaana myös erilaisille yhteistyökuvioille.

Janne Hakulinen