Schwerpunkte

Fußball-EM 2021

Statistiker prognostizieren den Titelgewinner

07. Juni 2021, 11:02 Uhr   |  Corinne Schindlbeck

Statistiker prognostizieren den Titelgewinner
© flucas/stock.adobe.com

Wer wird EM-Sieger? Forscher der Universitäten Innsbruck und Gent, der Technischen Universitäten Dortmund und München und der Hochschule Molde haben mit Hilfe eines Machine-Learning-Modells simuliert, wer die besten Chancen auf den EM-Titel hat.

Die Prognose der Forschenden: Frankreich wird Europameister, mit einer Gewinnwahrscheinlichkeit von 14,8 Prozent.

Das internationale Team aus Andreas Groll und Franziska Popp (beide TU Dortmund), Gunther Schauberger (TU München), Christophe Ley und Hans Van Eetvelde (beide Universität Gent), Achim Zeileis (Universität Innsbruck) und Lars Hvattum (Hochschule Molde, Norwegen) hat seine Prognose mit Hilfe von maschinellem Lernen erstellt.

Sie kombiniert dabei mehrere statistische Modelle für die Spielstärken der Teams mit Informationen über die Team-Struktur (etwa Marktwert, Anzahl Champions-League-Spieler, Vereinsspiele-Performance einzelner Spieler) sowie sozio-ökonomische Faktoren des Herkunftslandes (Bevölkerung und Bruttoinlandsprodukt).

100.000 Mal simuliert

Mit den vorhergesagten Werten aus dem Modell wurde die gesamte EM 100.000 Mal durchsimuliert: Spiel für Spiel, der Turnierauslosung und allen UEFA-Regeln folgend. Damit ergeben sich Wahrscheinlichkeiten für das Weiterkommen aller Teams in die einzelnen Turnierrunden und letztendlich für den EM-Sieg.

Nach dem Favorit Frankreich folgen knapp England mit 13,5 Prozent Gewinnwahrscheinlichkeit und Spanien (12,3 Prozent). Das Turnier ist natürlich dennoch nicht gelaufen – das zeigen auch die relativ knappen Abstände bei den Gewinnwahrscheinlichkeiten an der Spitze, außerdem natürlich die ohnehin niedrige Wahrscheinlichkeit selbst der Top-Nationen.

"Es liegt in der Natur von Prognosen, dass sie auch danebenliegen können – sonst wären Fußball-Turniere auch sehr langweilig. Wir liefern eben Wahrscheinlichkeiten, keine Gewissheiten, und eine Gewinnwahrscheinlichkeit von 15 Prozent heißt zugleich, dass die Mannschaft zu 85 Prozent nicht Turniersieger werden kann“, sagt Achim Zeileis.

Bisher seien  die Prognosen aber durchaus erfolgreich gewesen: Das Innsbrucker Modell von Achim Zeileis, das auf bereinigten Quoten der Wettanbieter basiert, konnte unter anderem bereits 2008 das EURO-Finale, sowie 2010 und 2012 Welt- und Europameister Spanien richtig vorhersehen. Dieses Jahr wird es als Teil des umfassenderen kombinierten Modells eingesetzt, das von den Teams um Andreas Groll (TU Dortmund), Gunther Schauberger (TU München) und Christophe Ley (Universität Gent) entwickelt wurde und das bei der Fußball-Weltmeisterschaft 2018 die Prognosegüte der Wettanbieter übertroffen hatte.

Und Deutschland? 

Die deutsche Nationalmannschaft stellt sich dieses Jahr in einer besonders herausfordernden Gruppe: „In Gruppe F sind drei sehr starke Teams, darunter der amtierende Weltmeister Frankreich und der Europameister Portugal, beide zugleich die Finalisten der EURO 2016, plus eben Deutschland“, erläutert Andreas Groll: „In dieser Gruppe ist die Wahrscheinlichkeit deshalb verglichen mit den Favoriten in den anderen Gruppen geringer, es bis ins Achtelfinale zu schaffen. Wer das aber schafft, hat dann ganz gute Chancen, weiterzukommen.“

Die Prognose sieht sowohl für Deutschland als auch Portugal eine Wahrscheinlichkeit von 85,3 Prozent, es ins Achtelfinale zu schaffen; für Frankreich liegt diese Wahrscheinlichkeit etwas höher bei 89,7 Prozent. Dass Deutschland Europameister wird, ist mit 10,1 Prozent Wahrscheinlichkeit deutlich unter den Werten der Favoriten und genau gleichauf mit Portugal.

Die Berechnung der Forscher*innen basiert auf vier Informationsquellen: Ein statistisches Modell für die Spielstärke jedes Teams auf Basis aller Länderspiele der vergangenen acht Jahre (Universität Gent), ein weiteres statistisches Modell für die Spielstärke der Teams auf Basis der Wettquoten von 19 internationalen Buchmachern (Universität Innsbruck), weitere Informationen über die Teams, zum Beispiel der Marktwert, und ihre Herkunftsländer, etwa die Bevölkerungszahl (TU Dortmund und TU München), außerdem detaillierte Ratings der einzelnen Spieler und deren individueller Performance sowohl in ihren Stammvereinen und Nationalmannschaften (Hochschule Molde). Fünfte Quelle bzw. fünfter „Partner“ ist ein Machine-Learning-Modell, das die anderen vier Quellen zusammenführt und sie schrittweise optimiert.

Das Modell sei zuvor mit historischen Daten trainiert worden, wie Andreas Groll erläutert: „Wir haben das Modell mit den jeweils zu dem Zeitpunkt aktuellen Daten für die vergangenen vier Europameisterschaften, also zwischen 2004 und 2016, gefüttert und mit den tatsächlichen Spielausgängen aller Spiele der jeweiligen Turniere vergleichen lassen – so wird die Gewichtung der einzelnen Informationsquellen für das aktuelle Turnier im Idealfall sehr genau ausfallen.“ 
 

Auf Facebook teilen Auf Twitter teilen Auf Linkedin teilen Via Mail teilen

Verwandte Artikel

elektroniknet, Technische Universität München Lehrstuhl für Biomedizinische Physik Physik-Department (E17)