Fußball Statistik Analyse: Welche Daten für Prognosen wirklich zählen

Fußballstatistiken sind überall. Ballbesitz, Passquote, Zweikampfwerte, Laufleistung — Sender und Websites überfluten Zuschauer mit Zahlen. Die Frage ist nicht, ob Daten verfügbar sind. Die Frage ist, welche davon tatsächlich etwas vorhersagen. Denn die meisten Statistiken im Fernsehen sind Unterhaltung, keine Analyse.
Die richtigen Zahlen lesen — das unterscheidet den informierten Analysten vom Datensammler. Viele Statistiken, die im Fernsehen prominent präsentiert werden, haben kaum Prognosekraft. Andere, weniger bekannte Metriken sind deutlich aussagekräftiger. Wer Fußballergebnisse vorhersagen will, muss lernen, zwischen deskriptiven und prädiktiven Statistiken zu unterscheiden. Es ist der Unterschied zwischen Wissen, was passiert ist, und Verstehen, was passieren wird.
Deskriptive Statistiken beschreiben, was passiert ist: Wie viele Pässe wurden gespielt? Wie viel Prozent Ballbesitz hatte Team A? Diese Zahlen sind nicht nutzlos, aber sie erklären die Vergangenheit, ohne die Zukunft zuverlässig vorherzusagen. Prädiktive Statistiken gehen weiter. Sie erfassen Faktoren, die mit zukünftigen Ergebnissen korrelieren — oft gegen die Intuition.
Die wichtigsten Prognose-Metriken
Expected Goals — xG — hat die Fußballanalyse revolutioniert. Die Metrik misst nicht, wie viele Tore gefallen sind, sondern wie viele hätten fallen sollen, basierend auf der Qualität der Torchancen. Eine Analyse von Anzer und Bauer, veröffentlicht auf arXiv, identifizierte den wichtigsten Faktor für xG: die Distanz zum Tor. Je näher der Schuss, desto höher die erwartete Torwahrscheinlichkeit. Winkel, Spielsituation und Schussart folgen in der Bedeutung.
Die Berechnung von xG ist komplex. Jeder Torschuss wird anhand historischer Daten bewertet: Aus welcher Position wurde geschossen? War es ein Kopfball oder ein Schuss mit dem Fuß? Wie viele Verteidiger standen im Weg? Daraus ergibt sich eine Wahrscheinlichkeit zwischen 0 und 1. Ein Elfmeter hat einen xG-Wert von etwa 0,76; ein Fernschuss von 25 Metern liegt bei 0,03. Die Summe aller Schüsse eines Spiels ergibt den Team-xG-Wert.
Warum ist xG besser als echte Tore? Weil Tore im Fußball selten sind und stark von Zufällen abhängen. Ein Team kann dominieren und trotzdem verlieren. xG filtert diesen Lärm heraus und zeigt die zugrunde liegende Qualität der Mannschaft. Über eine Saison hinweg konvergieren xG und tatsächliche Tore — aber in einzelnen Spielen können die Abweichungen enorm sein. Ein Team mit 3.0 xG, das 0:1 verliert, war wahrscheinlich das bessere Team.
xGA — Expected Goals Against — ist das defensive Gegenstück. Teams mit niedrigem xGA lassen wenige hochwertige Chancen zu. Diese Metrik ist oft aussagekräftiger als die reine Anzahl der Gegentore, weil sie Glück oder Pech des gegnerischen Abschlusses herausfiltert. Ein Torwart, der überdurchschnittlich viele Schüsse hält, verbessert die Gegentor-Statistik, aber nicht zwingend die Qualität der Defensive.
PPDA — Passes Per Defensive Action — misst die Pressingintensität. Teams mit niedrigem PPDA attackieren den Gegner früh und häufig. Diese Zahl korreliert mit Erfolg in den oberen Ligen, wo Pressing eine etablierte Strategie ist. Für Prognosen ist PPDA nützlich, weil es Spielstile quantifiziert, die schwer zu sehen, aber messbar zu machen sind.
Die Kombination dieser Metriken — xG, xGA, PPDA — ergibt ein Bild der tatsächlichen Spielstärke, das zuverlässiger ist als die Tabelle allein. Ein Team auf Platz 10 mit starkem xG-Saldo ist oft besser als sein Rang suggeriert. Umgekehrt sind Teams mit hohen Torausbeuten bei niedrigem xG oft überschätzt — Regression zur Mitte ist wahrscheinlich. Die Tabelle lügt nicht, aber sie erzählt auch nicht die ganze Wahrheit.
Überraschend unwichtige Statistiken
Ballbesitz sagt fast nichts über Spielausgänge aus. Die Korrelation zwischen Ballbesitz und Punkten ist in den meisten Ligen schwach. Teams wie Atlético Madrid haben über Jahre hinweg mit unterdurchschnittlichem Ballbesitz Titel gewonnen. Der Mythos, dass Ballbesitz gleich Dominanz bedeutet, hält sich hartnäckig — aber er ist falsch. Manche der erfolgreichsten Mannschaften der letzten Jahre haben bewusst auf Konterangriffe gesetzt und den Gegner kommen lassen.
Eckbälle sind ein weiterer überraschend schwacher Prädiktor. Viele Zuschauer sehen Ecken als gefährliche Situationen, aber die Torquote aus Eckbällen liegt unter 5 Prozent. Ein Team, das mehr Ecken hat, ist nicht automatisch im Vorteil. Die Qualität der Flanken und die Kopfballstärke der Spieler zählen weit mehr als die bloße Anzahl. Ironischerweise sind Ecken für das verteidigende Team oft gefährlicher — Konter nach Ecken führen häufiger zu Toren als die Ecken selbst.
Passquote ist ähnlich irreführend. Eine hohe Passgenauigkeit kann bedeuten, dass ein Team den Ball kontrolliert — oder dass es nur sichere Pässe spielt und nie Risiko eingeht. Teams, die aggressive Diagonalbälle und Tiefenpässe versuchen, haben niedrigere Passquoten, aber oft mehr Durchschlagskraft. Die Zahl allein sagt nichts über die Qualität der Pässe.
David Sumpter, Mathematikprofessor an der Uppsala University und Autor von Soccermatics, bringt es auf den Punkt: „Models aren’t reality. Goals are reality.“ Diese Aussage ist eine Warnung vor übermäßigem Vertrauen in jede einzelne Statistik. Selbst xG ist ein Modell — eine Annäherung an die Wahrheit, keine perfekte Abbildung. Die beste Analyse kombiniert mehrere Metriken und bleibt skeptisch gegenüber jeder einzelnen.
Schüsse aufs Tor — eine der ältesten Fußballstatistiken — sind ebenfalls problematisch. Ein Fernschuss von 25 Metern zählt genauso wie ein Schuss aus fünf Metern, obwohl die Torwahrscheinlichkeit um ein Vielfaches unterschiedlich ist. xG korrigiert dieses Problem; reine Schussstatistiken nicht. Die Unterscheidung zwischen Quantität und Qualität ist der Kern moderner Fußballanalyse.
Daten richtig interpretieren
Die Grenzen der Statistik zu kennen ist genauso wichtig wie die Statistik selbst. Eine Studie der Karls-Universität Prag analysierte die Genauigkeit verschiedener Prognosemodelle. Das Ergebnis: Selbst fortgeschrittene xG-basierte Modelle erreichen bei Drei-Wege-Vorhersagen nur etwa 50 Prozent Trefferquote. Das ist besser als Raten, aber weit entfernt von Sicherheit. Wer 100 Prozent erwartet, wird enttäuscht.
Stichprobengröße ist entscheidend. Fünf Spiele sagen wenig über eine Mannschaft aus. Zehn Spiele sind besser, aber immer noch anfällig für Zufallsschwankungen. Erst nach 15 bis 20 Spielen stabilisieren sich die meisten Metriken auf aussagekräftige Werte. In der Hinrunde sind Prognosen daher unsicherer als in der Rückrunde — ein Faktor, den viele Analysten unterschätzen.
Das Phänomen der Regression zur Mitte ist zentral. Ein Team, das in den ersten Spielen deutlich über seinem xG-Niveau trifft, wird wahrscheinlich in den folgenden Spielen weniger Tore schießen. Umgekehrt: Ein Team mit viel Pech bei der Chancenverwertung wird sich erholen. Die Statistik korrigiert sich selbst — aber nicht sofort und nicht immer vollständig.
Kontextfaktoren bleiben wichtig. Eine Statistik ohne Kontext ist gefährlich. Wenn ein Team niedrigen xG hat, liegt das vielleicht am schwachen Kader — oder daran, dass es gegen die Top-Teams gespielt hat. Der Spielplan verzerrt alle Metriken, besonders früh in der Saison. Ein starkes Team, das gegen Bayern, Dortmund und Leipzig begonnen hat, wird schwächer aussehen als es ist.
Die beste Interpretation ist vergleichend. Wie steht das xG dieses Teams im Vergleich zu ähnlichen Gegnern? Wie entwickelt sich die PPDA im Saisonverlauf? Trends sind oft aussagekräftiger als Momentaufnahmen. Ein Team, dessen xG-Saldo sich verbessert, ist wahrscheinlich auf dem aufsteigenden Ast — auch wenn die Ergebnisse noch nicht folgen.
Statistiken ersetzen nicht das Fußballverständnis, aber sie disziplinieren es. Sie verhindern, dass ein einzelnes spektakuläres Spiel das Gesamtbild verzerrt. Sie zeigen Muster, die dem Auge entgehen. Wer die richtigen Zahlen liest — und ihre Grenzen kennt —, hat einen Vorteil gegenüber jenen, die nur auf Ergebnisse schauen. Das ist kein Geheimwissen. Es ist methodisches Arbeiten mit öffentlich verfügbaren Daten. Die Werkzeuge sind frei zugänglich; die Disziplin, sie richtig einzusetzen, ist der eigentliche Unterschied.