Cijfertjes en sport horen al vele decennia bij elkaar. Sinds de eerste serieuze sportevenementen werden georganiseerd werden opstellingen uitslagen, records en tijden bijgehouden en verzameld. Vooral voor kranten en radio was het waardevol om deze data te publiceren. Het creëerde de content die deze media nodig had om sportliefhebbers te informeren over de prestaties die geleverd werden. Hierdoor kwamen ook de verschillende sporten en sporters aan meer publiciteit. Goede prestaties of spannende uitslagen werden bij een groter publiek bekend waardoor de uitstraling van sport en sporters steeds groter werd.
Vooral in Amerika waren kranten en radio belangrijke mediums waardoor sportprestaties landelijk steeds meer mensen konden bereiken.
De sporten waarin statistieken gemakkelijk bijgehouden konden worden zoals honkbal atletiek en de verschillende teamsporten kregen hierdoor meer dan gemiddelde aandacht. Op deze manier werden de sporten bij de mensen binnengebracht. Er kon over gesproken en gediscussieerd worden. Zo kon de populariteit van deze sporten exponentieel toenemen.
Vooral een teamsport als honkbal (baseball in Amerika) was uitermate geschikt om allerlei data te verzamelen die voor de luisteraars of lezers interessant was. De data werd door de journalisten gebruikt om hun analyse van de wedstrijd te maken. Zo konden ze gemakkelijk verklaren waarom het ene team won en het andere verloor. Maar ook waarom de ene speler beter was dan de andere.
Het was vervolgens logisch dat de data ook gebruikt ging worden door de teams om te analyseren waar het sterke of zwakke punt van de tegenstander lag. Welk individu waarin gevaarlijk was. Wanneer welke tactiek gebruikt werd of gebruikt moest worden.
Doordat er steeds meer belang werd gehecht aan data kwamen er steeds meer mensen die steeds meer verschillende data bij gingen houden op een steeds efficiëntere manier. Hierdoor is er op dit moment nog betrouwbare data beschikbaar van basebal wedstrijden van 100 jaar geleden.
Het beschikbaar hebben van alle mogelijke cijfers gaf de coaches een extra steun om hun strategie of wedstrijd tactiek te perfectioneren. Om vervolgens wedstrijden te winnen.
De belangrijkste vraag door de vele decennia heen was welke statistieken nu de belangrijkste waren. Welke het belangrijkste waren om wedstrijden door een heel seizoen winnend af te sluiten.
Door de jaren heen is hier weinig onderzoek naar gedaan. Men ging er vanuit dat de spelers met veel homeruns of gestolen honken ook de meest effectieve zouden zijn om hun team te laten winnen.
Pas na honderd jaar bleek dat uit de analyses naar effectiviteit een gecombineerde statistiek een betrouwbaarder beeld te geven naar de winstkansen. Deze gecombineerde statistiek werd het on-base percentage genoemd. Het gaat hier om spelers die in verhouding met het aantal keren dat ze aan slag komen relatief vaak op een honk terecht komen. Dit kan door meer dan gemiddeld een honkslag te slaan. Het percentage homeruns is dan minder belangrijk. Wat echter ook bleek was dat bepaalde spelers meer dan gemiddeld de strijd met de werper wonnen waardoor ze met 4 wijd automatisch op het eerste honk konden komen en zo interessant werden voor het team om de honken vol te krijgen. Nu dit bekend werd moest er anders naar de teamopstelling worden gekeken, Anders naar de scouting van nieuwe spelers en anders naar de beoordeling van wie de beste spelers waren. Deze gecombineerde statistiek veranderde het begrip van de sport.
Bij voetbal worden ook al vele jaren uitslagen en opstellingen bijgehouden waardoor er veel bekend is gebleven over wie er speelde, scoorden en de assists gaven.
Hier bleef het echter vaak bij. Voetbal was een sport die nooit stil lag. Er was voor de journalisten weinig tijd om bij te houden hoe vaak iemand balbezit had, hoeveel duels hij won of hoeveel geslaagde passes iemand afleverde. De journalist deed indrukken op, had het gegeven van de uitslag en de doelpuntenmakers en gaf aan de hand van een tiental momenten die hij zich herinnerde zijn
Visie van de wedstrijd. Hierin was natuurlijk veel ruimte voor discussie met mensen die de wedstrijd anders hadden gezien. Deze mensen hadden vervolgens weer discussie met de krantenlezers. Voetbal gaf zo veel stof om over de praten wat volgens mij een belangrijke factor is geweest in de populariteit van deze sport.
Omdat statistieken maar beperkt konden worden bijgehouden speelden ze geen grote rol bij de analyses van journalisten of coaches.
Pas in de laatste twee decennia zien we door de technologie de mogelijkheid ontstaan om goede betrouwbare gegevens van wedstrijden te verzamelen. Door het turven van voetbalacties via computers of trackingsystemen komt er allerlei data beschikbaar die vervolgens door coaches kan worden gebruikt in analyses en strategie om wedstrijden te winnen.
De hoofdvraag is nu welke data de uitslag van een voetbalwedstrijd bepaalt
Deze vraag is in basebal gedurende 100 jaar geëvolueerd en zal zich misschien nog wel verder ontwikkelen in de komende jaren.
In voetbal wordt hij echter nu pas gesteld. Hopelijk hebben we er geen 100 jaar voor nodig om hierin een goede effectieve formulering te vinden die ook goed zal verklaren waarom een team heeft gewonnen.
Hoewel nog niet op de voorgrond is er een groep slimme analisten bezig met behulp van de steeds beter beschikbare data modellen te ontwikkelen die kunnen aangeven waarom het ene team meer wint dan het andere. Het wordt voor de coach straks interessant om deze modellen te gebruiken in zijn belang naar resultaat. De coach kan slim gebruik maken van eventueel nieuwe inzichten om de tegenstander te verslaan. Hij moet hiervoor wel beschikken over een open mind om aannames los te kunnen laten. Hij moeten openstaan als blijkt dat oude conclusies toch niet helemaal kloppen. Hij moet durven gangbare principes los te laten op zoek naar een nieuwe methode naar nog meer effectiviteit. Zeker geen gemakkelijke taak voor velen.
Een mooie link over dit onderwerp is de website van Sander IJtsma, www.11tegen11.net