A theoretical framework for upscaling species distribution models

enThis link goes to a English sectionesThis link goes to a Spanish section

Los modelos de distribución de especies (SDM) se han convertido en una de las herramientas predictivas más populares en ecología. Con el advenimiento de nueva tecnología, entre ellas en teledetección e informática, los datos ambientales de alta resolución a grandes escalas se han convertido en predictores cada vez más comunes en estos esfuerzos de modelización. Por lo tanto, es fundamental entender la influencia de los cambios de escala, y en particular de la resolución, sobre el éxito predictivo de los resultados, para comprender mejor su aplicabilidad y generalidad.

En este estudio desarrollamos una base teórica para comprender las consecuencias de agregar datos ambientales y de ocurrencia a diferentes resoluciones. Proporcionamos un marco teórico, junto con simulaciones numéricas y un estudio de caso del mundo real, para mostrar cómo estas reglas de escala influyen sobre los resultados predictivos.

Mostramos que las propiedades de las relaciones ambiente-ocurrencia cambian cuando los datos se agregan a resoluciones más gruesas: la probabilidad media de ocurrencia y la prevalencia de las especies aumentan, los valores ambientales óptimos cambian, y las tasas de clasificación (éxito predictivo en términos de presencia-ausencia) aumentan hasta cierto nivel. Además, y contrariamente a la expectativa generalizada de que los datos de alta resolución producirían universalmente mejores predicciones, aquí mostramos que el éxito predictivo de estos modelos puede aumentar utilizando datos de resolución más gruesa. Finalmente, también mostramos que el desempeño de un modelo depende no solo de la relación ambiente-ocurrencia, sino también de la interacción entre ésta y la geografía y distribución del ambiente disponible.

Este marco teórico ayuda a comprender resultados que parecían previamente incoherentes con respecto a la mejora del poder predictivo de los SDM cuando se utilizan datos de menor resolución, e ilustra cómo los resultados teóricos y empíricos pueden proporcionar elementos importantes para avanzar en la comprensión de los problemas de escala en macroecología. La interacción entre la forma de la relación ambiente-ocurrencia y las tasas de cambio del gradiente ambiental es fundamental para comprender los efectos del aumento de escala en el éxito predictivo de los modelos y puede explicar por qué algunos modelos son más difíciles de transferir a diferentes regiones. Aún más importante, argumentamos que existen nociones conceptuales relacionadas con la escala y el ajuste de los modelos que requieren del conocimiento de los expertos taxonómicos, al igual que más exploraciones entre la teoría y la práctica en macroecología.

enThis link goes to a English sectionesThis link goes to a Spanish section

Species distribution models (SDM) have become one of the most popular predictive tools in ecology. With the advent of new computation and remote sensing technology, high-resolution environmental data sets are becoming more and more common predictors in these modelling efforts. Understanding how scaling affects their outputs is therefore fundamental to understand their applicability.

Here, we develop a theoretical basis to understand the consequences of aggregating occurrence and environmental data at different resolutions. We provide a theoretical framework, along with numerical simulations and a real-world case study, to show how these scaling rules influence predictive outputs.

We show that the properties of the environment–occurrence relationships change when the data are aggregated: the mean probability of occurrence and species prevalence increases, the optimal environmental values shift and classification rates increase at coarser resolutions up to a certain level. Furthermore, and contrary to the widespread expectation that high-resolution data would produce better predictions, we show here that model performance may increase using coarser resolution data sets rather than the inverse. Finally, we also show that model performance depends not only on the environment–occurrence relationship but also on the interaction between this and the geography and distribution of the available environment.

This theoretical framework helps understanding previously incoherent results regarding SDM upscaling and model performance, and illustrates how theoretical and empirical results can provide important feedbacks to advance in understanding scaling issues in macroecology. The interaction between the shape of the environment–occurrence relationship and the rates of change of the environment is fundamental to understand the effects of upscaling in model performance, and may explain why some models are more difficult to transfer to different regions. Most importantly, we argue that there are conceptual choices related to scaling and SDM fitting that require expert knowledge and further explorations between theory and practice in macroecology.

Keyword(s)

AUC, ENM, prediction, resolution, scaling, SDM, spatial scale

Full Text

FilePagesSizeAccess
Publisher's official version
121 Mo
Appendix S1. Mathematical presentation of the theory behind the paper.
29704 Ko
Appendix S2. Methods, code and supplementary figures for the case study presented in the paper.
8423 Ko
How to cite
Meynard Christine N., Piou Cyril, Kaplan David (2023). A theoretical framework for upscaling species distribution models. Methods In Ecology And Evolution. 14 (11). 2888-2899. https://doi.org/10.1111/2041-210X.14207, https://archimer.ifremer.fr/doc/00854/96614/

Copy this text