L’auteur, agrégé de mathématiques, a travaillé dans un magasin de cycles et est l’accompagnateur technique de cyclistes professionnels ; aujourd’hui data scientist pour une équipe cycliste, il nous parle de son nouveau métier.
CC : D’abord, qu’est-ce qu’un data scientist ? Quelle différence y a-t-il avec un data manager ou un data analyst ? Et y a-t-il des mots français (ou en québécois) pour désigner ces métiers ?
Le data scientist a pour rôle de collecter, trier, analyser des données et de les rendre visuelles et compréhensibles à l’aide de graphiques. Ceci se fait grâce à un panel d’algorithmes et d’outils de programmation informatiques. L’analyse des données est effectuée notamment à l’aide de modèles statistiques qui demandent des connaissances approfondies en mathématiques. Un bon data scientist doit aussi connaître son domaine de travail, ici le cyclisme et la physiologie du sportif. Ces dernières connaissances, je les ai acquises à travers ma vie de sportif, mais aussi par les lectures d’articles scientifiques spécialisés. L’intelligence artificielle dont on entend souvent parler dans les médias repose en partie sur le traitement de gros volumes de données par des algorithmes sophistiqués, mais je n’en fais pas encore dans mon travail, ce n’est pas la priorité. Cela pourra changer à l’avenir.
Le terme data scientist est générique mais, dans les grandes entreprises, il existe des métiers plus segmentés, comme le data manager dont le rôle est de créer et d’organiser les bases de données pour les mettre à la disposition de ses collègues, ou le data analyst qui se concentre sur l’analyse et l’exploitation décisionnelle des données. Ce sont des métiers qui requièrent moins de compétences transversales que celui de data scientist, qui est en quelque sorte le couteau suisse de la science des données.
« Il s’agit de travailler mieux pour progresser, et pour cela les data scientists ont un rôle positif à jouer. »
Pour ces nouveaux métiers très « internationaux », on utilise très peu l’équivalent français « scientifique des données », qui ne sonne pas très bien, je trouve, et même les Québécois emploient le terme data scientist . Par contre, on parle plus volontiers de « science des données », comme le montre l’article consacré sur Wikipédia.
CC : Tu n’es pas informaticien à l’origine. Il fallait donc une formation complémentaire, laquelle ?
Je suis professeur de mathématiques de formation, mais j’avais un profil très orienté vers l’informatique avant ma reconversion, car j’ai fait une licence maths-informatique à Lyon et j’ai toujours aimé programmer, ce qui n’est pas toujours le cas chez les professeurs de maths. Surtout, j’ai continué à coder après mes études, en particulier pour résoudre des problèmes de maths et d’algorithmique, donc la reconversion n’a pas été difficile. Cependant, pour devenir data scientist, il faut acquérir des connaissances sur les algorithmes utilisés dans l’analyse de données et savoir comment les implémenter (les coder) en utilisant les bonnes bibliothèques en langage informatique. Je voulais une formation courte et m’y mettre à 100%, et j’ai trouvé ce qui me correspondait. La formation était à la fois théorique grâce aux cours et pratique à travers les projets concrets à réaliser. Je bénéficiais d’un mentor avec qui j’avais une séance hebdomadaire en visio-conférence pour faire le point sur l’avancée de mes projets, ce qui était parfait pour moi durant le début de la pandémie de covid-19.
CC : Comment l’entraînement des coureurs cyclistes a-t-il évolué depuis vingt ou trente ans, avec les capteurs, les oreillettes, le suivi médical, etc. ? A quels types d’informations as-tu accès ?
Il y a trente ans, les coureurs parcouraient plus de kilomètres qu’aujourd’hui à l’entraînement, mais celui-ci était moins « qualitatif », c’est-à-dire comportait moins de travail spécifique, notamment à haute intensité. Aujourd’hui, tous les entraînements sont à thème et structurés : on fait de l’intervalle training, des sprints, du travail en force ou au contraire en vélocité avec modification de la fréquence de pédalage. Ils misent aussi beaucoup sur les phases de récupération avec des sorties plus tranquilles et même des phases de quelques jours sans rouler. Tout cela est planifié de manière cohérente en fonction des objectifs, des caractéristiques et de l’état de forme du sportif. Pour résumer, on peut dire que les coureurs roulent moins mais mieux qu’avant.
« Aujourd’hui, grâce à une approche scientifique de l’entraînement, les coureurs roulent moins de kilomètres qu’avant et une attention toute particulière est mise sur leur santé. »
Les données que j’exploite sont principalement celles des compteurs GPS, qui donnent une quinzaine de variables toutes les secondes. Les données les plus importantes pour nous sont les puissances (en watts) qui sont acquises grâce à des capteurs présents dans les pédaliers, mais aussi la cadence de pédalage (en tours par minute), la fréquence cardiaque et le positionnement (altitude, coordonnées GPS).
CC : Quel est ton jour type ? Que fait un data scientist au quotidien dans une équipe cycliste ?
Mon jour type ressemble à celui d’un développeur en informatique, avec le sport en plus, car au sein d’une équipe cycliste il est parfaitement légitime d’aller rouler avec les collègues entre midi et deux ! J’ai plusieurs projets en parallèle qui s’inscrivent dans la durée. Depuis que je suis arrivé dans l’équipe, je développe principalement des outils d’analyse de suivi des entraînements et des courses à destination des entraîneurs, et je fais des analyses statistiques des caractéristiques des coureurs comme le pédalage. 90% de mon temps se passent donc devant un ordinateur à écrire du code. Pour le moment je ne procède pas à des acquisitions de données sur le terrain, mais cela pourra évoluer à l’avenir.
CC : Les coureurs deviennent-ils des robots, des êtres humains « augmentés » ? Ces suivis très scientifiques ne font-ils pas perdre au sport sa poésie ?
Il est certain que le cyclisme d’aujourd’hui n’est plus celui d’il y a trente ans ou plus. Aujourd’hui, un coureur qui s’échappe seul en début d’étape a très peu de chances de gagner car les équipes sont très bien organisées. Mais on ne peut pas dire que les coureurs sont devenus des robots pour autant, les courses restent indécises et les scénarios sont variés et intéressants à suivre. Ceux qui gagnent sont évidemment très forts mais ce sont aussi ceux qui « sentent » bien la tactique de course, qui savent gérer leur effort et à la fois « débrancher le cerveau » au bon moment. Et débrancher le cerveau ne veut pas dire calquer sa course par rapport à son compteur et ses données, mais au contraire savoir s’affranchir des données pour pouvoir dépasser ses limites. Notre coureur David Gaudu qui a terminé quatrième du Tour de France cette année le dit très bien dans une vidéo dans laquelle il raconte son tour sur Internet. À certains moments clés, il ne s’agit plus de calculer !
« Les données sont devenues incontournables pour le suivi d’un athlète et constituent un outil précieux pour l’entraîneur. »
Les données sont aujourd’hui devenues incontournables pour le suivi d’un athlète et constituent un outil précieux pour l’entraîneur. Elles permettent d’avoir une rigueur indispensable à la réussite et de réaliser un suivi minutieux de la progression, de mettre le doigt sur d’éventuelles faiblesses. Par exemple, un œil expert remarquera certainement qu’un coureur pédale trop en force, ne tourne pas assez vite les jambes, et les données permettront de quantifier et de préciser dans quelles conditions il peut améliorer sa cadence de pédalage.
Pour le coureur, les données sont un moyen d’analyse supplémentaire en plus de ses propres sensations, et elles ont un aspect ludique également. Chaque coureur connaît ses propres records de puissance sur différentes durées et c’est un événement lorsqu’il bat l’un de ses records.
CC : Avec toutes les données à ta disposition, peux-tu savoir si un coureur est dopé et avec quoi ?
Pour le moment, la biologie reste maîtresse concernant le dopage et je pense que ce sera encore le cas pour les années à venir. Pour développer des méthodes de recherche de dopage reposant sur les données, il faudrait réaliser de coûteuses études scientifiques incluant de nombreux coureurs non dopés et dopés (à l’aveugle), et encore je ne sais pas si cela pourrait donner des résultats suffisamment solides scientifiquement pour être mis en pratique. En revanche, je pense que l’exploitation des données peut fournir une indication sur les coureurs à cibler. Il faudrait pour cela que les instances aient accès à des données fiables des coureurs à l’entraînement et en compétition. Là encore, ça me paraît difficilement faisable car les données sont aisément modifiables.
« Le data scientist a pour rôle de collecter, trier, analyser des données et de les rendre visuelles et compréhensibles à l’aide de graphiques. »
Les coureurs sont-ils demandeurs de ces algorithmes ou les subissent-ils ?
Ils ont accès aux résultats statistiques donnés par ces algorithmes à travers les analyses de leur entraîneur. Certains sont plus intéressés que d’autres, mais globalement, si la présentation des données est claire, oui ils sont plutôt demandeurs et les résultats sont très utiles pour eux. Le plus intéressant pour moi, c’est de pouvoir discuter avec ceux qui ont la fibre scientifique, comme l’un des nôtres, Valentin Madouas, qui est aussi ingénieur et qui aura un avis intéressant sur la partie technique de l’analyse des données.
CC : De façon plus générale, penses-tu que les data scientists peuvent aider à l’amélioration des conditions de travail ou qu’au contraire ils les aggravent ? Et cela pas seulement pour les sportifs.
Pour répondre à cette question, on peut faire le parallèle avec les nouvelles technologies qui apparaissent dans notre société. Toute nouveauté peut amener le pire comme le meilleur selon ce qu’on en fait. Les recherches sur la radioactivité et le nucléaire ont mené aux appareils d’imagerie médicaux modernes, mais aussi aux bombes nucléaires. Il en va de même pour la télévision, Internet et toutes les technologies de notre quotidien : il en ressort le meilleur comme le pire, tout dépend de ce qu’on en fait. Aujourd’hui, grâce à une approche scientifique de l’entraînement, les coureurs roulent moins de kilomètres qu’avant et une attention toute particulière est mise sur leur santé. Il ne s’agit pas de travailler plus pour gagner plus, mais de travailler mieux pour progresser, et pour cela les data scientists ont un rôle positif à jouer.
Olivier Mazenot est data scientist pour l’équipe Groupama-FDJ.
Propos recueillis par Pierre Crépel et Louis Devillaine