Pourquoi une carrière en écologie statistique?
Dans le cadre d’un documentaire que réalise Lise Viollat, celle-ci m’a posé des questions sur mon parcours en recherche, et en écologie statistique. Je reproduis mes réponses ici. Merci Lise pour l’entretien !
Est-ce que vous pouvez vous présenter? En quoi consiste votre travail, votre parcours ?
Mon travail est motivé par des questions sur l’écologie des grands mammifères, et les grands carnivores en particulier (loups, ours et lynx).
Quelles questions ? Très basiquement : combien y a-t-il d’animaux, et où sont-ils, et pourquoi ces effectifs et cette distribution.
Ces questions peuvent paraître très simples, mais le gros problème est qu’on ne peut pas facilement voir ces animaux. Il faut des méthodes pour échantillonner, pour gérer les incertitudes de comptage, de détection des individus et des espèces, et pour prédire aussi, combien et où. Et c’est là que les statistiques entrent en jeu.
Je travaille en écologie statistique, je suis ce qu’on pourrait appeler un éco-statistien. Et je travaille au CNRS, le Centre National de la Recherche Scientifique.
Pour arriver au CNRS, j’ai eu un parcours plutôt classique. J’ai étudié les mathématiques jusqu’à la licence. Une licence que j’ai redoublée, j’en faisais encore des cauchemars jusqu’à récemment. Puis à partir du Master je me suis orienté vers les mathématiques appliquées avec les statistiques. Je me suis embarqué dans une thèse en statistique appliquée à l’écologie, et à la dynamique des populations d’animaux, avec l’estimation de la survie et de la dispersion. Après la thèse à Montpellier, j’ai fait un détour par Grenoble, puis je suis parti en Angleterre et en Ecosse pour voir comment c’était ailleurs, me faire mon propre réseau, et surtout apprendre l’anglais.
Une fois recruté, je me suis de plus en plus intéressé aux questions d’écologie évolutive, et de conservation. J’ai aussi travaillé de plus en plus sur des questions en lien avec les grands mammifères, des espèces en interaction avec les activités humaines.
Pour mieux comprendre ces interactions, on fait appel aux sciences humaines et sociales. J’ai donc repris des études en sociologie. J’ai suivi quelques cours en licence, mais je n’ai pas pu aller au bout du Master. Je continue de me former sur le tas.
Qu’est-ce que pour vous l’écologie ?
Je ne suis certainement pas la bonne personne pour répondre à la question, je n’ai jamais étudié l’écologie à l’université. J’ai appris au contact de mes étudiantes, de mes étudiants, et de mes collègues, et sur le tas.
J’aime bien les définitions, alors je me lance. L’écologie c’est l’étude des processus qui influencent la distribution et l’abondance des espèces, les interactions entre ces espèces, et les interactions entre ces espèces et leur environnement. La thèse de Maud Quéroué est un exemple de l’étude de ces interactions entre espèces grâce à de nouveaux modèles statistiques.
C’est la science des interactions en bref, et c’est ça que j’aime dans cette discipline. Entre les espèces, entre les espèces et leur environnement. Dans les espèces, je mets aussi les humains. Et pour le coup on revient à cette idée de mobiliser écologie et sciences humaines et sociales, et l’étude des socio-écosystèmes dans lesquels on mélange écologie, politique, économie, sociologie et anthropologie. La thèse de Gilles Maurer est une illustration de cette démarche, et combine démographie, génétique, économie et anthropologie pour étudier les relations entre éléphant d’Asie et humains.
Pour finir, quand on parle d’écologie, il faut l’entendre au sens large, avec l’idée qu’on parle aussi des processus évolutifs qui contribuent à expliquer la variabilité dans les systèmes biologiques. Les thèses de Marlène Gamelon et Mathieu Buoro sont des exemples de travaux mêlant écologie et évolution pour mieux comprendre la dynamique des populations animales.
Comment est-ce que vous définiriez l’écologie statistique ? La modélisation ?
Dans écologie statistique, l’ordre des mots est important. On ne dit pas statistique pour l’écologie. C’est l’écologie qui motive, qui pose les questions. Les statistiques n’en deviennent pas pour autant une simple boîte à outils, mais il faut accepter les énoncés de l’écologie pour faire des statistiques pertinentes.
Venant des mathématiques et des statistiques, c’est quelque chose qui ne m’était pas naturel. En statistiques, on voit souvent les données de l’écologie comme l’application numérique pour montrer que la méthode statistique marche avec un exemple de données réelles (en complément aux données simulées souvent).
J’ai appris l’importance de motiver les statistiques par les questions écologiques au contact de Jean-Dominique Lebreton un de mes directeurs de thèse, qui le tenait lui-même de Jean-Marie Legay qui a beaucoup réfléchi sur la place de la modélisation en biologie, et l’interdisciplinarité.
L’écologie statistique c’est donc appliquer et surtout développer des méthodes et des outils statistiques pour répondre aux questions de l’écologie. En France, la communauté scientifique se retrouve sur ces thèmes dans le groupement de recherche en écologie statistique que nous avons créé en 2014.
La statistique de manière générale, c’est la science qui permet de collecter, analyser et tirer des conclusions à partir des données. Les trois sont importants pour l’écologie. Comment on récolte des données pour tester des hypothèses écologiques. Comment on les analyse. Et comment on interprète les résultats.
C’est à l’étape d’analyse qu’on utilise surtout des modèles. Un modèle dans ce contexte c’est une abstraction de la réalité, qui se base sur ce qu’on sait, et qu’on utilise pour extraire de l’information en utilisant les probabilités. Un exemple de modèle statistique c’est la régression linéaire simple dans laquelle on essaye de faire passer une droite dans un nuage de point pour expliquer une tendance.
A quoi elles servent d’après vous ?
Pourquoi est-il important de poser les questions “où sont les espèces?”, et “combien y a-t-il d’animaux?”. Les espèces qu’on étudie sont au contact des humains, et de leurs activités. Les activités de pêche pour le grand dauphin en Méditerranée par exemple, ou l’élévage d’ovins pour les loups en France pour prendre un autre exemple.
Dans ce contexte, je dirais que l’écologie statistique et la modélisation servent principalement à trois choses. Comprendre, prédire, et aider à la décision.
Je prends l’exemple du loup sur lequel on travaille beaucoup avec les collègues de l’ Office Français de la Biodiversité.
Comprendre d’abord. On a besoin de connaître les facteurs qui expliquent la distribution de l’espèce, ce sont des informations qui permettent d’établir le statut de conservation par exemple, celui de l’UICN. C’était la thèse de Julie Louvrier qui a permis de montrer que l’espèce est plastique et la façon dont l’espèce a recolonisé le pays.
Prédire ensuite. Julie a aussi montré qu’on pouvait prédire à court terme la dispersion de l’espèce avec un modèle mathématique qu’on confrontait aux données. Autre exemple, dans sa thèse, Nina Santostasi a évalué l’efficacité de différents scénarios de gestion de l’hybridation entre chiens et loups en Italie.
Enfin, l’aide à la décision. L’espèce est gérée par l’état français, et c’est entre autres sur la base d’effectifs que nous produisons grâce à l’écologie statistique que le nombre maximal de prélèvements est établi chaque année. C’était la thèse de Lucile Marescot. On a aussi besoin de connaître l’effet des tirs mis en place sur la prédation par le loup des troupeaux domestiques, un problème complexe de statistique spatiale. C’est la thèse d’Oksana Grente qui a soutenu récemment.
Pour résumer, on parle beaucoup de biodiversité et de services rendus par les écosystèmes, et donc d’interdépendance entre les humains et la nature. Une connexion qui s’oublie de plus en plus pour reprendre un thème cher à Alix Cosquer qui travaille dans notre équipe en psychologie de l’environnement.
Dans ce contexte, l’écologie statistique sert à comprendre, à prédire et à informer la prise de décision sur les interactions entre les espèces, animaux et humains, et leur environnement.
Pourquoi avoir choisi cette carrière ?
Plusieurs raisons, dans le désordre.
- C’est un privilège incroyable que d’être payé pour faire le métier de chercheur, qui plus est avec le statut de fonctionnaire. A titre personnel, je ne voulais pas connaître les conditions de travail difficiles de mes parents. A titre professionnel, ce statut offre de bonnes conditions pour faire notre métier. Un poste permanent permet de travailler en collaborant avec les collègues. C’est un point important car la recherche c’est une aventure à plusieurs, une aventure d’équipe ; on n’arrive à rien, ou à pas grand-chose, quand on travaille seul (en tous cas moi). On ne fait pas une bonne recherche en poussant à plus de compétition.
Notre statut permet aussi de s’inscrire dans un temps long, ce temps long qui est indispensable à une recherche de qualité, une recherche qui sert la société aussi. Nos travaux sur le loup dont je parlais ont commencé il y a plus de 10 ans ! Ce temps long est mis à mal par la précarisation de l’emploi qui touche le monde de la recherche de plein fouet, avec de plus en plus de CDDs, et je m’inquiète des conséquences pour la jeune génération bien sûr. Plus de compétition. Plus d’administratif, plus d’excellence. Aller vite. Quantité. Productivité. Moins de postes. Moins de moyens. On gère la recherche et l’enseignement comme une entreprise, il faut optimiser, rationnaliser, les étudiants sont des clients. Ca ne peut pas marcher. Désolé je m’égare…
-
Une autre raison pour laquelle j’ai choisi cette carrière est que j’avais envie de m’attaquer à des problèmes appliqués, qui pourraient avoir des applications concrètes pour les gens, pour la société. Ou au moins de contribuer un peu en ce sens. Être utile en gros.
-
Un autre raison est qu’il est très (très) gratifiant d’accompagner la nouvelle génération de scientifiques. C’est excitant, j’adore faire un bout de chemin avec celles et ceux qui s’embarquent dans un master, une thèse, ou un post-doc.
-
Enfin, ce métier permet d’être tout le temps en mouvement dans sa tête. On apprend tout le temps. On est en permanence stimulé intellectuellement. J’adore ça.
Faut-il être douer en math pour faire ce métier ?
Ca veut dire quoi « doué en maths » en fait ? Ca fait penser à cette expression « avoir la bosse des maths ». Cette expression vient du 19ème siècle et d’une pseudo-science qui s’appelait la phrénologie. On établissait un lien entre vos capacités ou traits de caractères et les régions du cerveau, avec l’idée que ça se répercutait sur la forme du crâne. Les bons en maths avaient une bosse sur le front qui correspondait à l’endroit supposé du cerveau où se faisait les maths. C’est absurde! On a montré depuis que les mathématiques mobilisent différentes zones du cerveau.
Il y a un bouquin très chouette de Stanislas Dehaene professeur au collège de France en psychochologie cognitive qui s’appelle justement la bosse des maths. Que dit ce bouquin? On a tous la bosse des maths. Le sens du nombre, du dénombrement. C’est en entrainant ce sens qu’on s’améliore, qu’on devient meilleur en maths. Comme avec un instrument de musique.
Le principal obstacle est sûrement le langage, car les maths c’est aussi un langage. A nouveau comme en musique. Ca demande de l’apprendre pour la lire, l’écrire, et comprendre ce que se disent les gens qui en font. Une fois qu’on a fait nos gammes, on peut vraiment s’amuser, se faire plaisir.
Ce qui est important de réaliser, c’est qu’on peut utiliser les maths en écologie quel que soit son niveau. De la simple règle de trois que je maitrise à peu près, jusqu’à l’utilisation des équations différentielles stochastiques auxquelles je n’ai rien compris. Chacun et chacune peut y trouver son bonheur, et faire une recherche tout à fait pertinente. Pour les statistiques je conseille le livre de David Spiegelhalter qui introduit la discipline de façon très abordable.
Qu’est ce qui vous plait dans ce que vous faite ?
C’est d’abord les personnes avec qui je travaille. Ma plus grosse motivation vient de mes étudiantes et de mes étudiants. J’ai envie de travailler avec eux, d’échanger, d’interagir. On en revient aux interactions. Ce sont aussi les gens de mon équipe. J’apprends tout le temps. Et ce sont les gens de la communauté en écologie statistique en France et à l’étranger. C’est une communauté qui ne se prend pas trop au sérieux, mais qui fait une recherche sérieuse et excitante pour répondre aux grandes questions qu’on se pose sur la crise de la biodiversité. C’est aussi très agréable de se sentir appartenir à une communauté. A ce propos, nous organisons les prochaines journées du GDR Ecologie Statistique à Montpellier début avril 2022, n’hésitez pas à nous rejoindre !
La deuxième chose, je l’ai déjà mentionné, c’est le fait d’exercer un métier dans lequel on est toujours en mouvement intellectuellement. On apprend, on essaye, on tente des choses, on explore, on joue, on écrit, on lit, on réfléchit, tout en se sentant utile à son niveau à la construction des connaissances.
La troisième chose c’est le partage. Le partage des connaissances via l’accompagnement des étudiantes et des étudiants d’abord, j’en ai parlé. Et l’enseignement aussi. J’en fais peu quand on compare aux collègues de l’enseignement supérieur qui forcent le respect. J’ai déjà du mal à garder la tête hors de l’eau avec mon métier de chercheur, eux en font deux, ils sont chercheurs et enseignants ! Dans le partage, je mets aussi des ateliers que nous proposons sur plusieurs jours au cours desquels on forme aux méthodes de l’écologie statistique. Ce sont des formations gratuites et filmées pour que le plus grand nombre y ait accès.
Quels sont les futurs enjeux de l’écologie ?
Je n’en sais rien du tout! Je ne me considère pas vraiment comme un écologue. Les seules choses qui me viennent à l’esprit sont en lien avec nos thématiques de recherche évidemment. Je pense à la conservation de la biodiversité. Comment trouver un équilibre, et un équilibre durable entre nos activités et la nature qui nous entoure? Ca sous-entend mieux comprendre les interactions entre les acteurs humains et non-humains, pourquoi ces interactions peuvent mener à des conflits et comment les résoudre. Ca veut dire aussi travailler sur des systèmes complexes, ces fameux socio-écosystèmes, et donc encore plus d’ouverture de l’écologie aux sciences humaines et sociales.
Des statistiques et de la modélisation ?
Je suis pas forcément plus à l’aise pour parler des enjeux en statistiques, mais on y a un peu réfléchi avec les collègues du GDR EcoStat, et je suis donc un peu moins sec que pour l’écologie. J’en vois trois.
-
La modélisation des socio-écosystèmes d’abord. Il y a besoin d’intégrer différentes disciplines dans des approches multi-agents (économie, géographie, ethnologie). On se demande comment utiliser les approches de modélisation pour estimer les quantités importantes de ces modèles complexes.
-
On a une explosion des moyens technologiques déployés à toutes les échelles d’organisation. Je pense aux pièges photos, à l’ADN environnemental, aux GPS, aux drones, aux photos aériennes ou satellites, etc. Nous sommes face à une masse conséquente de données dont il est souvent difficile d’extraire l’information pertinente. Le deuxième enjeu est donc celui des données massives, et du développement d’approches qui permettent d’apprendre de ces données, et d’automatiser des tâches qui deviennent impossibles à faire par des humains. Je pense évidemment au machine learning, et au deep learning en particulier.
-
Le troisième enjeu est celui de l’écologie prédictive. Comment prédire les phénomènes écologiques? Ca demande de manipuler des systèmes de grandes dimensions qui couplent écologie et physique par exemple, ou océan et atmosphère pour prendre un autre exemple. Ca demande aussi de réfléchir à comment propager les incertitudes d’estimation et d’échantillonnage tout le long de l’analyse, jusqu’à la prédiction.
Y a-t-il un outil, un courant de pensée, une découverte qui pour vous a tout changé dans votre domaine ?
Oui, clairement! C’est l’introduction de la théorie bayésienne au début des années 2000. J’ai découvert cette théorie en post-doc en Angleterre puis en Ecosse avec ma collègue Ruth King et d’autres.
Qu’est-ce que le bayésien ? L’idée est de mettre à jour la connaissance a priori qu’on a d’un système qu’on étudie grâce à l’expérimentation, avec les données qu’on accumule sur ce système. Cette connaissance a priori, on peut la voir comme la confiance qu’on a en une hypothèse, et le bayésien permet alors de mettre à jour ce degré de confiance grâce aux données. Le bayésien permet de formaliser la façon naturelle qu’on a de raisonner, d’induire les chances qu’une hypothèse soit vraie ou fausse.
La théorie bayésienne est utilisée un peu partout en sciences, mais aussi dans le monde de tous les jours par exemple en médecine pour faire un diagnostic, en informatique pour calibrer l’anti-spam de votre boîte électronique, en finance pour gérer des portfolios d’actions, et elle a même permis à Alan Turing de craquer la machine Enigma qui permettait aux allemands de communiquer par messages codés.
La force de la théorie bayésienne vient aussi du fait qu’elle vient avec des algorithmes pour la mettre en pratique qui sont très puissants. Très puissants au sens où on peut utiliser des modèles de plus en plus complexes et de plus en plus proches de ce qu’on sait des espèces qu’on étudie, des modèles qu’on ne pouvait pas rêver d’utiliser avant.
Pour vous donner du concret, je pense à un exemple. En écologie on cherche souvent à modéliser la distribution des espèces. Ca demande d’avoir des données sur des grandes surfaces pour être sûr qu’on a échantillonné tous les habitats favorables ou pas à l’espèce. C’est difficile à faire avec un protocole scientifique exigeant et coûteux. On voit que les sciences participatives permettent d’échantillonner à moindre coût sur de grandes surfaces. Mais les données sont biaisées car si on voit beaucoup là où il y a des observateurs et observatrices, ça ne veut pas dire que là où il n’y a personne, il n’y a pas l’espèce ; ça veut simplement dire que là où on a des gens, l’espèce est détectée. L’analyse bayésienne permet de combiner ces différents suivis pour quantifier la distribution en combinant les avantages des deux types de suivi, des données non-biaisées par les protocoles scientifiques, et une grande couverture spatiale par les programmes participatifs. C’est la thèse de Valentin Lauret.
Il ne faut pas me lancer sur la théorie bayésienne, je l’enseigne en Master et pour les doctorants et doctorantes de notre école doctorale et je ne m’en lasse pas!
Pourriez vous donnez un exemple d’un de vos travaux ?
C’est un travail sur le lynx en France. La première cause de mortalité du lynx sont les collisions avec les voitures. Un gros enjeu consiste donc à trouver des moyens de réduire cette mortalité par collision. On a développé un modèle qui permet d’évaluer des scénarios pour réduire cette mortalité. Par exemple construire un passage à faune, en gros un tunnel ou un pont par lequel les animaux peuvent traverser la route sans risque. On a voulu que cet outil puisse être utilisé par les acteurs du dossier lynx, et en particulier par l’état en région via les DREAL (Direction régionale de l’Environnement, de l’Aménagement et du Logement). On a donc encapsulé toutes les composantes modélisation dans un logiciel utilisable par des non-spécialistes. Tout est fait dans le logiciel R, donc le tout est ouvert et reproductible !
Pourquoi j’ai choisi ce projet ?
D’abord parce que c’est un projet qui mélange différents types de modélisation, statistique et informatique, différentes disciplines avec écologie et statistique, et sous-disciplines de l’écologie avec écologie du paysage, écologie du déplacement, et la dynamique des populations.
Ensuite parce qu’humainement c’est un projet au cours duquel je me suis beaucoup remis en question. On a choisi de montrer la modélisation aux acteurs avec des ateliers où on a présenté les modèles, et où on s’est fait remettre en place. Les acteurs avaient un niveau d’exigence très élevé, à la fois sur les modèles, sur leur utilisation, les sorties, le maintien à long terme du logiciel et la mise à jour des données. Au final, la co-construction nous a permis d’être beaucoup plus pertinents que si on avait fait le même travail de modélisation au laboratoire.
Toujours humainement, c’est un projet qui finit bien, puisque la post-doctorante qui a été le trait d’union entre les différents partenaires, et qui a fait l’essentiel du travail, Sarah Bauduin, a été recrutée à l’Office Français de la Biodiversité.
Enfin, c’est un projet qui ouvre sur d’autres questions de recherche, avec un focus sur les problèmes de connectivité dus à la fragmentation par les infrastructures de transports terrestres (voiture et train). C’est la thèse de Maëlis Kervellec qu’elle vient tout juste de démarrer.
Un message pour les jeunes qui pourrait être intéresser par cette voie ?
Vous voulez dire le message du vieux con à la jeune génération? Je trouve toujours difficile de passer un message, de donner un conseil. D’autant que pour moi ça a marché, mais clairement j’ai eu de la chance, beaucoup de chance. Ce qui a marché pour moi ne marchera pas forcément pour d’autres. En ce sens mon message et mes conseils ne valent pas grand-chose.
Je vais vous faire du Ted Lasso, et je dirais : intéressez-vous, lisez, posez des questions, soyez curieux de ce que font les autres, et pourquoi ils le font. N’écoutez pas trop les conseils des vieux, et faites votre propre chemin.
Et rigolez, ne vous prenez pas trop au sérieux !
Une anecdote à partager ?
Une conséquence plutôt positive des confinements. C’est l’histoire d’une formation en dynamique des populations que nous avons proposée en 2006 avec une 30aine de participants à l’époque. J’ai relancé ça avec deux collègues et amis de l’équipe, Aurélien Besnard et Sarah Cubaynes. Un tweet et deux messages à des mailing lists plus tard, on en est à 2315 inscrits au bout de 15 jours ! On ne sait pas trop comment on va gérer tous ces gens, mais c’est très excitant ! Beaucoup de personnes inscrites viennent de pays où l’accès à la connaissance est difficile pour des tas de raisons. On fait donc une formation gratuite et en ligne, et on l’enregistre. C’est vers là que j’aimerais aller, plus de partage de la connaissance. Ça fait un peu grandiloquent, mais les besoins sont criants pour la conservation de la biodiversité.
📢👋 Together with @SarahCubaynes and @abesnardEPHE we will be giving a 2-day introductory workshop March 21-22 on quantitative methods for population dynamics in R #rstats Join us 🥳 It's online and free of charge 😉 You just need to register https://t.co/I5sNS5kDOo Please RT 😇 pic.twitter.com/rkw8JWZBJi
— Olivier Gimenez 🖖 (@oaggimenez) October 11, 2021