Veikkauksen noin vuosi sitten järjestämässä vetoseminaarissa
Helsingin Casinolla yhtiön kertoimenlaskija Teemu Eirtovaara kertoi
paneelikeskustelussa parhaaksi kollegalta saamaksi opikseen sen, että joukkue
on juuri niin hyvä kuin sen peliesitykset kertovat. Ei materiaalin taso, ei toteutuneet
tulokset, vaan nimenomaan peliesitykset. Eirtovaaran puheenvuoro löytyy
Youtubesta.
Olen täysin samaa mieltä Eirtovaaran kanssa. Peliesitykset
ovat omassa työssäni ylivoimaisesti tärkein mittari joukkueiden rankingien ja
sitä kautta otteluiden todennäköisyysarvioiden määrittämisessä. Peliesitysten
arvioinnista ei ole mielestäni kirjoitettu ainakaan suomeksi missään, eikä
niistä ole käyty yleisillä keskustelupalstoilla kunnon keskustelua.
Kirjoitin viime keväänä blogitekstin Leicesterin tasosta
maaliodotusarvojen näkökulmasta. Nimenomaan
katsotuista peleistä itse tilastoitujen numeroiden pohjalta. Sen jatkeeksi
haluan nyt kirjoittaa peliesityksistä.
Pohjana
maaliodotusarvot
Tavoitteeni on arvioida joukkueiden suorituksia mahdollisimman
yksinkertaisesti ja jatkokäyttökelpoisesti. Joskus noin 5-10 vuotta sitten
annoin joukkueille numeraalisen arvosanan otteluiden peliesityksistä pitkälti
Stetson-Harrison-metodilla, mihin vaikutti luettu otteluraportti/valmentajan
kommentit, ottelun tilastot ja kenties highlight-kooste. Niiden pohjalta
muodostin käsityksen otteluiden ”reilusta lopputuloksesta” sekä joukkueiden
suoritustasosta. Siirryttyäni otteluiden maaliodotusarvojen tilastointiin sain
kuitenkin selkeän tartuntapinnan peliesitysten numeraaliseen arviointiin.
Viime keväänä kirjoittamani Leicester-pätkä sisälsi hieman
pohjatietoa maaliodotusarvoista, ja suosittelen lukemaan sen, mikäli et ole
vielä sitä tähän mennessä lukenut. Maaliodotusarvoista on materiaalia kuitenkin
paljon etenkin englanniksi, ja Suomessa asiasta on pitänyt ääntä etenkin
Rajainmäen Kari. Kari piti aiheesta erittäin
pätevän esitelmän viime kesänä Ylikerroin.comin
vedonlyöntiklinikalla/kesätapaamisessa.
Lyhyesti siis, ottelusta pyritään muodostamaan objektiivinen
kuva joukkueiden luomasta maaliuhasta. Jotkut mallintavat sitä Optan datasta,
jotkut katsovat pelit itse. Itse kuulun jälkimmäiseen kategoriaan. Tässä on
esimerkki yhden tämän kauden Valioliigaottelun muistiinpanoistani:
Ottelu on 11.3.2017
pelattu Hull–Swansea.
Taulukoissa Koti- ja Vieras-merkintöjen alla olevalla
rivillä numerot kuvaavat _suurin piirtein_ pelattuja minuutteja. Olen
pakottanut kaavoissani ottelut kestämään tasan 90 minuuttia, joten näissä on
pieniä heittoja todellisiin peliaikoihin. Eli tässä esimerkkipelissä ottelu on
ollut tasatilanteessa noin 70 minuuttia, Hull on johtanut yhdellä maalilla 9
minuuttia ja kahdella tai useammalla maalilla 11 minuuttia.
Alemmilla riveillä numerot ovat pelin sen hetkisiä
minuuttimääriä. Niiden vieressä oikealla puolella on pelitilanteen määritelmä
omia tilastojani varten, esim. et = erikoistilanne, vi = vastaisku jne. Ne
eivät ole tässä kohtaa merkityksellisiä. Niitä seuraa tilanteen arvioimani maaliodotusarvo.
Esimerkkinä olevassa Hull–Swansea-ottelussa Hull on luonut
omien tilastojeni mukaan yhteensä maaliodotusarvoa 1,47, josta tasatilanteessa
on luotu 0,86, yhden maalin johdossa 0,48 ja kahden tai sitä suuremman maalin
johtoasemassa 0,13.
Swansean ottelussa luoma maaliodotusarvo omissa
tilastoissani on 1,21, josta tasatilanteessa on luotu 0,91, maalin
tappioasemassa 0,02 ja kahden tai sitä suuremman maalin tappioasemassa 0,28.
Perustaso ja
ennakko-odotus
Oma joukkueiden tason analysointityö sekä otteluiden
todennäköisyysarvioiden laskenta perustuu maaliodotusarvoihin, joiden
esitysmuotona tykkään käyttää kolmea eri lukua: voitto/tappio-suhdetta (1)
kuvaamaan joukkueen kokonaistasoa, yli 2,5 maalin prosenttilukua (2) kuvaamaan
joukkueen kokonaismaalimäärää, ja kotietua (3) kuvaamaan kotiriippuvuutta. Tämä
on puhtaasti tottumuskysymys.
Otetaan esimerkiksi Valioliigasta Hull, jonka arvioin
tekevän sarjassa keskimäärin 0,90 maalia ja päästävän 1,57 maalia.
Käsittelen Hullia kyseisten maaliodotusten sijaan luvuilla 0,4 (1), 45 % (2) ja 1,12 (3). Luvut
0,4 ja 45 % tulevat Poisson-kaavan perustuvan laskurin kautta, kun siihen lyö
maaliodotusarvoiksi 0,90-1,57. Jos Poisson-laskuri ei ole tuttu, niin tässä on yksi esimerkki.
Maaliodotusarvoilla 0,90-1,57 saadaan 1X2-jakaumaksi n. 22–25–53
%, josta voitto/tappio-suhteeksi tulee n. 0,4 (22/53). Yli 2,5 maalin tuloksen
todennäköisyys näillä maaliodotusarvoilla on puolestaan se noin 45 %.
Kotietua 1,12 käytän sitten otteluiden
todennäköisyysarvioita laskiessa, ja niihin huomioin tietenkin molempien
kyseessä olevien joukkueiden kotiedut. Hull-esimerkkitapauksen luku 1,12
tarkoittaa sitä, että arvioin Hullin otteluissa kotijoukkueiden tekevän 12 %
enemmän maaleja ”puolueettomaan kenttään” verrattuna. Luku 1,12 tulee siis
kaavasta
Hullin
otteluiden kotijoukkueiden maalit
–––––––––––––––––––––––––––––––––––––––
(Hullin otteluiden kaikki maalit / 2)
Hyvä, eli nyt kun lähden arvioimaan joukkueen peliesityksen
tasoa jossain yhdessä ottelussa, otan ensin huomioon ennakko-odotuksen.
Tarkoitan siis joukkueen sen hetken rankingia/tasoa.
Hull–Swansea-esimerkkiottelussa joukkueiden rankingini ennen
ottelua ovat voineet olla esimerkiksi Hull 0,4 45 % 1,12 ja Swansea 0,5 44 %
1,11, ja näillä rankingeilla ottelun maaliodotusarvoni ovat n. 1,23–1,12, mitkä
tarkoittavat todennäköisyysarvioina esim. 38–30–32 %, yli-alle 2,5 maalia 42-58
%. Luvut tulevat ulos kertoimenlaskentatyökalustani, jonka perkaus sen
tarkemmin ei kuulu tähän aiheeseen.
Jutun juju on kuitenkin se, että ennakko-odotuksessa huomioidaan sekä oma oletettu perustaso että ennen kaikkea vastustajan taso.
Toteutunut peliesitys
Lähden siis siitä, että arvioimillani perustasoillaan
suorittaessaan Hull ja Swansea tuottavat Hullin kotona pelatessaan
maaliodotusarvot 1,23–1,12.
Katson ottelun ja teen muistiinpanoja pelitilanteiden
maaliodotusarvoista aiemmin esitettyyn tapaan. Saan siis tästä ottelusta
kokonaismaaliodotusarvoiksi 1,47–1,21. Huomaan, että peli oli tasatilanteessa
valtaosan (70/90 minuuttia) peliajasta, ja sinä aikana maaliodotusarvot olivat
0,86–0,91. Hull oli tässä tapauksessa onnekkaampi tehdessään avausmaalin, ja
johtoasemassa joukkue pääsi hyviin tilanteisiin Swansean joutuessa nostamaan
omia riskitasojaan. Avausmaalin jälkeen pelin kokonaismaalintekointensiteetti
nousi myös selvästi 0–0-tilanteeseen nähden.
En palkitse peliesitystä arvioidessani Hullia
täysimittaisesti siitä, että he olivat tällä kertaa onnekkaampia tehdessään
ottelun avausmaalin. En siis käytä peliesityksiä arvioidessani ottelun
kokonaismaaliodotusarvojani 1,47–1,21, vaan painotan tasaista pelin kuvaa
pitkään kestäneessä tasatilanteessa. Jos maalintekointensiteetti olisi jatkunut
samanlaisena läpi ottelun kuin se oli 0–0-tilanteessa, olisivat
maaliodotusarvot voineet olla n. 1,11 (0,86/70*90) – 1,17 (0,91/70*90).
Tässä kohtaa täytyy käyttää sitten omaa harkintaa, miten
paljon painottaa mitäkin ottelun tilannetta. Swansean koko pelin maaliodotus
oli omissa tilastoissani siis 1,21, ja tasatilanteen mukaan 90 minuutin
korjauksella 1,17. Swansean kohdalla 1,20 on siis hyvä pyöreä arvio tästä
pelistä.
Hullin kohdalla johtoasema tuotti heille ison edun. Koko
pelin maaliodotukseni Hullille oli siis 1,47, ja tasatilanteen mukainen luku
1,11. Käytän peliesitystä arvioidessani Hullin maaliodotuksena jotain lukua
näiden välimaastosta, mikä voisi olla esim. 1,20 tai 1,25. Päädytään tässä
kohtaa esimerkiksi 1,25:een.
Eli, olen arvioinut ensin ottelun maalipaikat numeraalisessa
muodossa saaden maaliodotusarvot ja painottanut niitä sitten eri pelitilanteet
huomioiden. Tämä painotus on minusta erittäin tärkeä osa-alue, sillä välillä
otteluiden kokonaismaaliodotusarvot muodostuvat todella harhaanjohtaviksi pelin
todellisesta kuvasta. Jalkapallossahan pelataan ensisijaisesti vain pisteistä.
Kolme pistettä saa yhtä lailla maalin kuin viiden maalin voitosta.
Jotkut joukkueet ovat suvereeneja tasatilanteessa ja esim.
1–0-johtomaalin syntyessä 40 minuutin kohdalla maaliodotusarvot voivat olla
1,10–0,05. 2–0-maali voi syntyä toisen jakson alussa 50 minuutin kohdalla ja
maaliodotusarvot olla siinä kohtaa 1,40–0,20. Loppupelistä johtoasemassa oleva
joukkue säästelee energiaa tulevaan europeliin ja vaihtaa esim. kaksi
avainpelaajaa pois tunnin kohdalla. Vieraat tekevät 2–1-kavennusmaalin 75
minuutin kohdalla jolloin maaliodotusarvot voivat olla 1,50–0,65, ja lopussa
vieraat saavat vielä pienen kirin päälle isäntien tyytyessä johdon suojeluun.
Pelin kokonaismaaliodotusarvoiksi voi muodostua esim. 1,60–0,80, vaikka
voittajasta ei ole ollut todellisuudessa juuri mitään epäselvyyttä.
Takaisin Hull–Swansea-otteluun. Olen arvioinut ottelun kuvan
mukaisiksi maaliodotusarvoiksi siis 1,25–1,20. Avaan sen jälkeen oman
kertoimenlaskentatyökaluni, jota käytin ennen ottelua maaliodotusarvojen
1,23–1,12 muodostamiseen. Sen arvion sain siis rankingeilla Hull 0,4 45 % 1,12
ja Swansea 0,5 44 % 1,11. Seuraavaksi muokkaan joukkueiden tunnuslukuja
mahdollisimman vähän kumpaakin, jotta saan kertoimenlaskentatyökalustani ulos
maaliodotusarvot 1,25–1,20. Tässä tapauksessa se toteutuu esimerkiksi tunnusluvuilla Hull 0,4 46 % 1,12 ja Swansea 0,55 46 % 1,11, jotka ovat
minun arvioni joukkueiden tämän ottelun peliesityksistä. Kun vertaan näitä
ranking-tunnuslukuja ennakko-odotuksiini joukkueiden sen hetken
perussuoritustasosta (Hull 0,4 45 % 1,12 ja Swansea 0,5 44 % 1,11), teen
johtopäätöksen, että molemmat pelasivat hieman odottamaani runsasmaalisemmin,
ja Swansea pelasi hieman odottamaani paremmin.
Listaan tässä kohtaa joukkueiden peliesitys-tunnusluvut ylös
Exceliin, josta löytyy allekkain samat luvut kauden kaikista muista otteluista.
Hullin kohdalla litania näyttää tämän pelin jälkeen omassa tiedostossani tältä:
Peliesitys
|
||
v/t
|
over
|
kotietu
|
0,3
|
41 %
|
1,02
|
0,5
|
45 %
|
1,06
|
0,5
|
38 %
|
1,04
|
0,7
|
34 %
|
1,04
|
0,4
|
51 %
|
1,03
|
0,15
|
28 %
|
1,17
|
0,35
|
36 %
|
1,06
|
0,2
|
44 %
|
1,20
|
0,15
|
38 %
|
1,00
|
0,3
|
35 %
|
1,10
|
0,3
|
51 %
|
1,08
|
0,3
|
61 %
|
1,09
|
0,3
|
31 %
|
1,05
|
0,2
|
27 %
|
1,14
|
0,4
|
59 %
|
1,15
|
0,4
|
52 %
|
1,10
|
0,5
|
47 %
|
1,04
|
0,3
|
49 %
|
1,09
|
0,4
|
39 %
|
1,09
|
0,55
|
40 %
|
1,02
|
0,4
|
49 %
|
1,09
|
0,5
|
38 %
|
1,09
|
0,7
|
35 %
|
1,09
|
0,6
|
38 %
|
1,09
|
0,5
|
48 %
|
1,09
|
0,6
|
48 %
|
1,20
|
0,55
|
39 %
|
1,10
|
0,4
|
46 %
|
1,12
|
Tuorein merkintä on listassa alimpana, ja ylimpänä on kauden
ensimmäinen ottelu. Tämä numerotaulukko on minulle yksittäisistä mittareista
ylivoimaisesti tärkein arvioidessani joukkueen tämän hetken perussuoritustasoa
sekä pelin kokonaistason, maalimäärän että kotiriippuvuuden suhteen.
Miten peliesitykset
korreloivat pisteisiin ja maalieroon muihin mittareihin verrattuna?
Miksi sitten painotan niin paljon peliesityksiä joukkueita
arvioidessani, enkä esimerkiksi puhtaasti tilastoimiani maaliodotusarvoja tai
yleisiä laukaisutilastoja? Syy on tässä:
Inspiraation taulukkoon sain tästä PenaltyKickStat'n julkaisusta,
ja käytin samoja perusteita kuin kyseisen blogitekstin tutkimuksessa:
I decided to use the R value (=correl in Excel) to
evaluate:
1.
the metric in question and
points/goal difference for the same season (is there a link between the two?)
2.
the metric in y and y+1 (is
the metric a repeatable skill?)
3.
the metric in y and pts / GD
in y+1 (is it predictive?)
Luvut ovat siis Excelin KORRELAATIO-funktiosta. Luku 1,00
tarkoittaa täydellistä korrelaatiota ja 0,00 ei lainkaan korrelaatiota.
Mittareista xG ero tarkoittaa itse tilastoimieni luotujen ja vastustajien
luoman maaliodotuksen erotusta, xGR maaliodotusarvosuhdetta (oma luotu
kokonaismaaliodotus/(oma + vastustajan luoma maaliodotus), TSR on yhtä kuin
total shots ratio, eli kaikkien laukausten suhde, ja SOTR on maalia kohti
suuntautuneiden laukausten suhde.
Luvut ovat kahdelta viimeisimmältä täydeltä
Valioliigakaudelta, eli otoskoko on varsin pieni (n=17) tutkittaessa mittarin
toistettavuutta ja ennustuskykyä.
Molemmissa kategorioissa pisteet ja maaliero
ovat huonoimpia mittareita. TSR pärjää hyvin SOTR:n kanssa, mutta xG:t sekä
erotuksen että ration suhteen ovat parempia mittareita. Peliesitys on kuitenkin
yksittäisistä mittareista paras sekä keskiarvon että mediaanin osalta. Alla on muutama pistekaavio eri mittareiden välisestä suhteesta peräkkäisillä kausilla (eli yllä olevan taulukon osasta 3).
Loppukiteytys
Kiteytettynä, peliesitystä kannattaa pyrkiä arvioimaan
mahdollisimman yksinkertaisesti ja omien menetelmien jatkokäyttöä silmällä
pitäen. Kun ottelutapahtumista muodostaa jonkinlaisen kuvan, on sitä helpoin
verrata omiin ennakko-odotuksiin (rankingiin) ja tutkia, millaisilla
ennakko-odotuksilla (ranking-arvioilla) saisi ulos omista menetelmistään
pelitapahtumia vastaavan tuloksen. Täten tulee huomioitua myös vastustajan taso, sillä on aivan eri asia voittaa ansaitusti vieraissa sarjakärki 2-0 kuin kotona sarjajumbo samanlaisilla lukemilla ja maalipaikkajakaumilla.
Jälkikirjoitus
Tämän tekstin kirjoittaminen oli mieluisin työhöni liittyvä
projekti pitkään aikaan. Pääsin helposti flow-tilaan ja aika hurahti todella
nopeasti. Tällaista työtä haluaisin enemmän tulevaisuudessa! Mikäli haluat
antaa palautetta tai jatkaa keskustelua aiheesta, ota yhteyttä esim.
Twitterissä tai sähköpostitse janne_hakulinen(at)hotmail(dot)com.
Suhtaudun avoimesti ja olen vapaana myös erilaisille yhteistyökuvioille.
Janne Hakulinen