
doi: 10.71781/34239
Le processus de pollinisation gérée fonctionne comme un système socio-écologique complexe, façonné par les décisions interdépendantes des apiculteurs qui offrent des services et des agriculteurs qui en font la demande. Ces interactions génèrent des boucles de rétroaction dynamiques, des résultats non linéaires et des comportements émergents, le tout dans un contexte de variabilité environnementale, d’hétérogénéité spatiale et d’incertitude temporelle. Une gestion efficace de ce système nécessite des approches de modélisation capables de capturer la prise de décision adaptative et les comportements guidés par la rétroaction dans des conditions diverses et évolutives. Les modèles multi-agents (ABM – Agent-Based Models) traditionnels, bien qu’utilisés pour explorer les dynamiques émergentes dans les systèmes complexes, reposent souvent sur des représentations comportementales statiques et basées sur des règles, limitant leur capacité à simuler une adaptabilité réaliste. Pour surmonter cette limitation, cette thèse propose un modèle multi-agents intégré à l’apprentissage par renforcement (RL-ABM – Reinforcement Learning Agent-Based Model), conçu pour simuler et optimiser les échanges de services de pollinisation à travers les régions agricoles de recensement (CAR) du Québec, sur un horizon de six ans (2025–2030). Le RLABM intègre l’apprentissage automatique (ML – Machine Learning) et l’apprentissage par renforcement dans un cadre multi-agents, permettant aux agents — agriculteurs et apiculteurs — d’apprendre des rétroactions environnementales, d’ajuster dynamiquement leurs décisions et de gérer les compromis entre rendement des cultures et survie des ruches. Le développement de ce modèle repose sur quatre études fondamentales. Premièrement, des cartes de cultures à haute résolution ont été générées à l’aide de séries temporelles d’images satellites Sentinel-2 et de trois architectures d’apprentissage profond : réseaux de convolution temporels 1D, réseaux de convolution spectrale 1D et réseaux LSTM (Long Short-Term Memory). Le modèle LSTM a obtenu la meilleure précision de classification, fournissant des données spatiales détaillées sur cinq cultures essentielles à la pollinisation, servant ainsi à modéliser le déploiement des ruches. La deuxième étude a porté sur la survie des colonies d’abeilles domestiques, à l’aide d’un modèle de Forêt Aléatoire de Survie (Random Survival Forest) pour analyser l’influence des variables environnementales, météorologiques et de gestion au Québec et en Californie. Le modèle a mis en évidence des facteurs régionaux spécifiques de mortalité et a permis de produire des cartes de potentiel apicole, classant plus de 64 % de chaque région comme favorable à l’apiculture. La troisième étude s’est intéressée à la prédiction des rendements du canola et du soya, en évaluant cinq modèles d’ensemble à l’échelle nationale. L’algorithme XGBoost (Extreme Gradient Boosting) a obtenu les meilleurs résultats, révélant que les pollinisateurs gérés expliquent plus de 50 % de la variabilité des rendements. Ces composantes ont ensuite été intégrées dans le RL-ABM, créant un environnement décisionnel où les agriculteurs demandent des ruches en fonction des rendements prévus, et les apiculteurs les attribuent selon les probabilités de survie anticipées. Les deux types d’agents utilisent des algorithmes d’apprentissage par renforcement pour faire évoluer leurs stratégies en réponse aux rétroactions du système. L’analyse comparative avec un modèle multi-agents sans apprentissage a montré que le RL-ABM produit un ensemble plus large et plus diversifié de solutions non dominées, en privilégiant souvent la viabilité des pollinisateurs avant l’optimisation du rendement. Les agents ont adapté leurs décisions aux conditions environnementales et climatiques changeantes, révélant des comportements nuancés selon les régions et les périodes. Cette thèse propose un cadre novateur, basé sur les données, pour simuler la prise de décision adaptative dans les systèmes de pollinisation. Le modèle RL-ABM soutient à la fois une production agricole durable et la santé des pollinisateurs, et offre un outil précieux pour les chercheurs, les décideurs et les parties prenantes souhaitant gérer les systèmes agroécologiques complexes dans un contexte d’incertitude et de variabilité climatique.
The managed pollination process functions as a complex socio-ecological system shaped by the interdependent decisions of beekeepers providing services and farmers requesting them. These interactions generate dynamic feedback loops, non-linear outcomes, and emergent behaviors, all within a context of spatial heterogeneity, environmental variability, and temporal uncertainty. Effective management of this system requires modeling approaches capable of capturing adaptive decision-making and feedback-driven behavior across diverse and evolving conditions. Traditional agent-based models (ABMs), although widely used to explore emergent patterns in complex systems, often rely on static, rule-based representations of behavior that fall short in simulating real-world adaptability. To address this limitation, this dissertation introduces a reinforcement learning-integrated agent-based model (RL-ABM) designed to simulate and optimize pollination service exchanges across Quebec’s census agricultural regions (CARs) over a six-year horizon (2025–2030). The RL-ABM integrates machine learning (ML) and reinforcement learning (RL) within the ABM framework, enabling agents—farmers and beekeepers—to learn from environmental feedback, dynamically adjust their decisions, and navigate trade-offs between crop yield and beehive survival. The development of the RL-ABM was grounded in four foundational studies. First, high-resolution crop maps were produced using Sentinel-2 satellite image time series and three deep learning architectures—1D temporal convolutional networks, 1D spectral convolutional networks, and long short-term memory (LSTM) networks. The LSTM model achieved the highest classification accuracy, offering detailed spatial data on five pollination-relevant crops essential for modeling hive deployment. The second study focused on the survival of managed honeybee colonies, employing a Random Survival Forest (RSF) model to analyze the influence of environmental, meteorological, and management variables across California and Quebec. The model revealed region-specific drivers of colony mortality and produced suitability maps that classified over 64% of each region as favorable for beekeeping. The third study addressed crop yield prediction for canola and soybeans by evaluating five ensemble ML models using national-scale data. Extreme Gradient Boosting (XGBoost) emerged as the most accurate, and the results showed that managed pollinators explained more than 50% of yield variability. These components were then integrated into the RL-ABM, creating a decision environment where farmer agents request hives based on predicted yields, and beekeeper agents allocate hives based on expected survival probabilities. Both agent types use RL algorithms to evolve their strategies in response to system feedback. Comparative analysis against a non-learning ABM demonstrated that the RL-ABM produced a broader and more diverse set of non-dominated solutions, often prioritizing pollinator viability before yield maximization. Agents adapted their decisions to changing environmental and climatic conditions, revealing regionally and temporally nuanced behaviors. This dissertation contributes a novel, data-driven framework for simulating adaptive decision-making in pollination systems. The RL-ABM supports sustainable agricultural production and pollinator health, offering a valuable tool for researchers, policymakers, and stakeholders aiming to manage complex agroecological systems under uncertainty and climate variability.
Intelligence artificielle géospatiale, Agent-based modeling (ABM), Apprentissage profond, Complex systems, Reinforcement learning (RL), Geographical information systems (GIS), Modèles multi-agents, Apprentissage automatique, Machine learning (ML), Spatial modeling, Systèmes complexes, Modélisation spatiale, Apprentissage par renforcement, Deep learning (DL), Systèmes d’information géographique, Geospatial artificial intelligence (GeoAI)
Intelligence artificielle géospatiale, Agent-based modeling (ABM), Apprentissage profond, Complex systems, Reinforcement learning (RL), Geographical information systems (GIS), Modèles multi-agents, Apprentissage automatique, Machine learning (ML), Spatial modeling, Systèmes complexes, Modélisation spatiale, Apprentissage par renforcement, Deep learning (DL), Systèmes d’information géographique, Geospatial artificial intelligence (GeoAI)
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
