Datathon: cum contribuie analiza de date la îmbunătățirea strategiilor în fotbal
Federația Română de Fotbal a lansat un proiect pentru dezvoltarea unei comunități de analiști de date care să furnizeze informații despre performanțele fotbaliștilor pentru cluburi și academii.
În 30 aprilie 1938, postul de televiziune BBC a transmis pentru prima oară în direct un meci de fotbal: finala Cupei Angliei dintre Preston North End și Huddersfield Town. Chiar și așa, audiența formată din cei 93.497 de spectatori de pe stadionul Wembley din Londra a fost mult mai mare decât audiența TV, întrucât la vremea respectivă doar 10.000 de britanici aveau televizoare acasă.
În cei aproape 90 de ani care au trecut de atunci, calitatea transmisiunilor sportive a crescut într-un ritm accelerat, iar televiziunile sunt astăzi capabile să ofere un meci de fotbal în cele mai mici detalii ale sale, de la simple gesturi făcute de sportivi în timpul meciurilor până la analize complexe despre corectitudinea deciziilor luate de arbitru.
În ultimii ani, imaginile transmise de camerele video au devenit atât de performante încât au permis specialiștilor să le utilizeze și pentru analizarea unui eveniment sportiv din punct de vedere tactic. Așa au apărut numeroase platforme digitale precum Wyscout sau Hudl care permit astăzi „disecarea” unui meci de fotbal nu doar după numărul de goluri și numărul de șuturi la poartă, ci și după parametri precum duelurile la cap câștigate sau pierdute de fiecare jucător sau schemele de pase. Și astea chiar sunt exemple banale.
În țările cu fotbal dezvoltat, astfel de date au început să fie utilizate în ultimii ani inclusiv de către cluburi pentru a analiza atât performanțele propriilor jucători, cât și pentru a înțelege mai bine jocul echipei adverse sau pentru a identifica mai ușor tinere talente.
În România, utilizarea unor astfel de date reprezintă mai degrabă o excepție. O excepție pe care Federația Română de Fotbal (FRF) încearcă să o transforme în regulă.
De la Intelligence Centre la Datathon
La începutul acestui an, FRF a inițiat proiectul Intelligence Centre, care își propune să centralizeze și să optimizeze utilizarea datelor despre performanțele fotbaliștilor cu scopul de a îmbunătăți rezultatele obținute de cluburi, academii și echipe naționale.
Unul dintre obiectivele noului proiect este dezvoltarea unei comunități de analiști de date care să furnizeze aceste informații, în condițiile în care numărul specialiștilor în date care lucrează în prezent în fotbal este foarte redus. Sau aproape inexistent.
În acest scop, FRF a organizat la sfârșitul lunii mai prima ediție a evenimentului Datathon, prin care a încercat să atragă persoane pasionate de fotbal cu experiență în roluri precum data analyst, data scientist sau data engineer, dar și reprezentanți ai cluburilor de fotbal care sunt interesați să folosească datele în activitatea curentă.
Am citit întâmplător pe site-ul FRF despre acest eveniment și, pentru că îmi place să analizez diverse date pentru articolele pe care le documentez pentru Autocritica, Patru Pereți sau Patru Tribune, am fost curios să aflu mai multe detalii.
Așa că l-am contactat pe Andrei Angelescu, managerul proiectului Intelligence Centre, care m-a invitat la sediul FRF pentru o discuție practică despre cum a fost prima ediție de Datathon.
„Majoritatea participanților la eveniment nu au avut experiență profesională în fotbal. Ca să compensăm lipsa lor de experiență cu datele despre fotbal, am avut în majoritatea echipelor și oameni care lucrează pentru unele cluburi din România. Pe lângă ei, toți paticipanții au beneficiat de mentori, unii dintre ei experți pe ambele zone, fotbal și date”, spune Andrei.
Ce fel de date au fost analizate
Participanții au fost grupați în 9 echipe de câte 5-6 persoane și au avut ca obiectiv să analizeze performanțele realizate de echipele naționale ale Ucrainei, Belgiei și Slovaciei, adică cele trei adversare ale României la EURO 2024, pe baza unor seturi de date brute primite de la organizatori.
„Participanții au avut acces la seturile de „event data” de la toate meciurile din preliminariile Campionatului European de Fotbal. Datele au fost furnizate de partenerul de date al evenimentului, compania Hudl, și sunt cele din spatele platformei WyScout”, completează Andrei.
Când spune „event data”, Andrei se referă la diverse tipuri de evenimente care au loc în timpul unui meci de fotbal. Printre datele de acest tip disponibile pe platforma WyScout se numără atât parametri previzibili precum goluri, pase sau driblinguri, cât și parametri mai complecși precum „deep completion”, care semnifică o pasă care trebuie să ajungă la cel mult 20 de metri distanță de centrul porții adverse, sau „reflexes save”, care simbolizează faptul că portarul a reacționat rapid pentru a-și salva echipa de la gol.
În acest caz, astfel de parametri sunt utili, de exemplu, pentru a identifica punctele slabe ale echipei adverse, pentru ca staff-ul tehnic să poată îmbunățăți tactica pentru mediul direct de la EURO 2024.
În mod tradițional, un proiect de analiză de date presupune colectarea datelor, „curățarea” datelor de eventuale erori, analiza propriu-zisă a datelor și prezentarea rezultatelor într-un format cât mai ușor de înțeles inclusiv de persoane care nu sunt specializate în date.
Echipele participante la Datathon au lucrat la acest proiect timp de două zile la sediul FRF, pe baza unei strategii ușor diferite.
„Procedura a fost standard, însă participanții au fost scutiți de etapele de colectare și cleaning. Seturile de date au putut fi accesate prin infrastructura pusă la dispoziție de Google Cloud (n.r - platformă de servicii în cloud deținută de Google), iar datele au putut fi interogate direct în BigQuery (n.r - platformă care returnează date prin interogări formulate într-un dialect de SQL, un limbaj utilizat pentru gestionarea bazelor de date informatice)”, explică Andrei.
Scopul principal a fost ca analiștii de date să identifice o serie de recomandări tactice prin care naționala României să-și îmbunătățească performanțele în meciurile din grupele EURO 2024.
„Le-am cerut participanților să se axeze mai degrabă pe insight-uri și să nu caute construirea unei platforme sau a unui instrument stabil, astfel încât să aibă o prezentare care să poată fi înțeleasă ușor de un antrenor de fotbal, care nu este neapărat un expert în date. Selectarea proiectelor finaliste s-a făcut în urma unor prezentări de 5 minute de tip elevator pitch, iar cele 3 echipe calificate în finală au avut timp să își îmbunătățească ideea și prezentarea”, mai spune Andrei.
Ce insight-uri a descoperit echipa câștigătoare
Andrei mi-a arătat prezentarea finală a echipei câștigătoare, însă din motive de confidențialitate nu o pot publica în cadrul acestui newsletter. Totuși, îți pot povesti despre proiectul câștigător pentru a înțelege mai bine despre ce este vorba.
Echipa care a câștigat Datathon a analizat în special calitatea jocului de pase ale celor trei adversare ale naționalei României. De exemplu, analiștii de date au studiat posesiile cu peste 10 pase consecutive reușite, durata medie a unei posesii sau numărul de recuperări realizate pe meci, precum și modul în care a fost câștigată sau pierdută posesia (de exemplu, în urma unor pase, intercepții sau dueluri aeriene).
Pe baza acestor date analizate, echipa câștigătoare a ajuns la o serie de concluzii. De exemplu, pentru meciul cu Ucraina, analiștii recomandă ca atacurile României să fie susținute inclusiv de defensivă în special între minutele 31-45, când Ucraina are un joc de pase mai puțin eficient, și atrag atenția că golurile Ucrainei sunt înscrise în special pe jos, mai exact pe centrul porții și în dreapta portarului.
În cazul Belgiei, analiștii au evidențiat că jucătorii acestei naționale înscriu frecvent din șuturile plasate pe jos în dreapta portarului (mai exact, 89% dintre șuturile plasate în acest mod s-au transformat în gol) și, în același timp, recomandă un pressing la fundașii dreapta datorită faptului că aceștia au frecvent jocuri de pase cu mijlocașii, ceea ce generează oportunități de intercepție.
În cazul meciului cu Slovacia, analiștii au recomandat un pressing și o poziționare mai avansată a jucătorilor României în special între minutele 16-30, când adversarii sunt mai vulnerabili la jocul de pase.
Echipa câștigătoare a fost formată din Diana Rusu (data scientist), Radu-Mihnea Pandea (data analyst), Radu Petrișor Moldovan (data analyst), Mihai Ghiță (data scientist) și David Emanuel Oprea (antreprenor).
Ce planuri de viitor există pentru Intelligence Centre
Pe termen lung, scopul proiectului Intelligence Centre și a evenimentelor de tip Datathon este realizarea unei comunități de date care să furnizeze astfel de informații pentru echipele naționale, academiile de fotbal sau echipele de juniori.
„Planul nostru pentru viitor pe zona de folosire a datelor în fotbalul românesc se leagă de proiectul FRF Intelligence Centre. Ne dorim ca acesta să vină nu doar în sprijinul echipelor naționale, ci și în cel al academiilor și cluburilor din România. Astfel, Datathon-ul a fost pentru noi acest moment T0, pentru a pune bazele unei comunități de experți care să lucreze cu întreg ecosistemul fotbalistic din România”, mai spune Andrei.
De altfel, o astfel de strategie unitară la nivel de federație este eficientă inclusiv din punct de vedere al costurilor: utilizarea unor platforme precum Wyscout sau Hudl poate genera costuri pe care academiile de fotbal sau cluburile de juniori nu și le permit, mai ales că ar veni la pachet cu necesitatea de a lucra individual cu specialiști din zona de date.
Pe de altă parte, nu doar costurile împiedică astfel de instituții sportive să folosească mai mult datele statistice despre fotbal, ci mai ales lipsa de deschidere și încredere în informațiile care pot fi obținute în acest mod.
„Din păcate, fotbalul românesc este în urmă comparativ cu țările dezvoltate din Europa și pe zona de folosire a datelor pentru informarea deciziilor de natură sportivă sau tehnică. În rândul cluburilor românești, zonele de pregătire fizică și analiză video sunt mai dezvoltate decât analiza de date”, încheie Andrei.
Abonează-te la newsletterul Patru Tribune și în curând vei citi o analiză despre provocările cu care se confrună Franța pentru a asigura securitatea cibernetică a Jocurilor Olimpice de la Paris.
Cum poți să analizezi și tu datele despre naționala României
Dacă îți place să lucrezi cu date și ai fi vrut să participi la Datathon-ul organizat de FRF am un pont pentru tine. FRF este în luna iunie partenerul comunității online RomanianDATA Tribe, care organizează în fiecare lună un challenge cu scopul de a îmbunătăți calitatea analizelor de date.
Pentru această lună, provocarea este să realizezi o analiză de date pe baza datelor puse la dispoziție de FRF despre meciurile jucate de România în preliminariile pentru EURO 2024. Astfel, poți analiza în detaliu fazele de joc, performanțele fiecărui jucător care a intrat pe teren sau numărul de spectatori prezenți în tribune la meciurile cu Elveția, Israel, Belarus, Kosovo și Andorra.
Cu alte cuvinte, un scop al analizei poate fi să identifici punctele forte ale jucătorilor, pentru ca aceștia să fie utilzați mai bine de către antrenor în schemele tactice.
Termenul limită pentru realizarea analizei de date este 20 iunie. Găsești toate detaliile despre acest challenge în postarea de pe LinkedIn a lui Claudiu Ionuț Anghelescu, cofondator RomanianDATA Tribe.
Mi-ar fi plăcut să-ți prezint în acest newsletter și propria mea analiză de date pentru acest challenge, însă aceasta este încă un lucru. Pot însă să-ți confirm că una dintre direcțiile pe care le-am ales este legată de eficiența șuturilor spre poartă ale jucătorilor români în cele 10 meciuri din preliminarii.
Conform regulamentului competiției, voi publica analiza pe LinkedIn până în 20 iunie și, dacă voi avea timp, voi povesti mai multe despre proiect într-un newsletter viitor.