Métodos alternativos a MaxEnt para SDM con datos limitados
La modelización de distribución de especies y Maxent afrontan dificultades cuando los registros de especies son escasos. Tres enfoques alternativos permiten modelizar nichos ecológicos con mayor flexibilidad en contextos de información escasa.
Figura: Tres enfoques para modelizar especies con tamaños de muestra pequeños.
Panel superior: el enfoque plug‑and‑play estima la tasa relativa de ocurrencia, f(occurrence), como la razón entre una distribución de presencia y una distribución de fondo.
Panel central: de forma alternativa, el enfoque de razón de densidades utiliza algoritmos capaces de estimar directamente la razón entre las distribuciones de presencia y de fondo.
Panel inferior: el enfoque basado en rangos ambientales omite la distribución de fondo e identifica el rango de condiciones ambientales que constituyen el nicho de una especie.
Estos tres enfoques ofrecen un conjunto de algoritmos que reflejan supuestos diversos sobre decisiones de muestreo o casos de uso. En la mayoría de situaciones se desconocerá qué supuestos se cumplen (por ejemplo, los relacionados con la completitud del muestreo, el sesgo, la estacionalidad, etc.).
Crear un conjunto de modelos que combine varios algoritmos y combinaciones de algoritmos que representen un abanico de supuestos permite captar esta incertidumbre, algo especialmente importante en especies con tamaños de muestra pequeños.
Comparación entre los métodos de
SDM
Los distintos algoritmos de SDM muestran patrones propios de sensibilidad y especificidad. La comparación revela que MaxEnt no siempre es el más eficaz y que otros métodos pueden ajustarse mejor a algunas situaciones.
Figura: l rendimiento de los algoritmos varía a lo largo de un gradiente de sensibilidad–especificidad.
La variación en sensibilidad y especificidad refleja diferencias en los supuestos sobre la forma del nicho y los sesgos de muestreo. Al elegir algoritmos que se distribuyen a lo largo de este gradiente, es posible representar la incertidumbre en las estimaciones de distribución.
Los modelos mostrados se clasifican según su algoritmo de presencia e incluyen todos los algoritmos de fondo (véase la Información suplementaria para más detalles sobre la variación en el rendimiento debida a los algoritmos de fondo).
Los puntos representan el rendimiento mediano de cada algoritmo y las líneas muestran los rangos intercuartílicos. Los modelos se ajustaron con datos de entrenamiento y las tasas relativas de ocurrencia (ROR) resultantes se convirtieron en datos binarios de presencia/ausencia seleccionando un umbral que excluía el 5% de las presencias del entrenamiento.
La sensibilidad y la especificidad se evaluaron con datos independientes de presencia–ausencia.
Abreviaturas: LOBAG‑OC (low‑bias bootstrap‑aggregating, one‑class), KDE (kernel density estimation), uLSIF (unconstrained least‑squares importance fitting), ruLSIF (relative unconstrained least‑squares importance fitting) y Maxnet (una implementación del algoritmo MaxEnt que utiliza glmnet para el ajuste del modelo)
Similitud entre las predicciones de los modelos de distribución de especies
Los métodos que comparten supuestos generan predicciones más parecidas. Entender estas relaciones ayuda a interpretar divergencias y a mejorar la modelización de nichos ecológicos con pocos datos.
Figura: La distancia en el gradiente sensibilidad–especificidad está correlacionada con la similitud de las predicciones.
La distancia sensibilidad–especificidad se calculó como la distancia euclidiana entre modelos en un espacio bidimensional donde un eje representa la sensibilidad y el otro la especificidad.
El grado de acuerdo entre modelos se calculó como la proporción de localidades del conjunto de datos de presencia/ausencia en las que ambos modelos coincidieron en predecir presencia o ausencia.
El índice de Jaccard se calculó como el número de localidades en las que ambos modelos coincidieron en predecir presencia dividido por el número de localidades en las que al menos uno de los modelos predijo presencia.
Los puntos representan las medias entre especies para cada par de algoritmos.
Los modelos se ajustaron con datos de entrenamiento y las tasas relativas de ocurrencia (ROR) resultantes se convirtieron en datos binarios de presencia/ausencia seleccionando un umbral que excluía el 5% de las presencias del entrenamiento.
La sensibilidad y la especificidad se evaluaron con datos independientes de presencia–ausencia.
La combinación de modelos de SDM mejora el rendimiento
Combinar varios métodos reduce la incertidumbre y mejora la robustez de las predicciones. Los conjuntos de modelos equilibran sensibilidad y especificidad y superan los enfoques individuales en SDM cuando los registros son limitados.
Figura: Los conjuntos se construyeron a partir de los algoritmos KDE/KDE, ruLSIF y Maxnet. La combinación se realizó de dos maneras:
promediando las predicciones de los modelos y aplicando después un umbral (lo que produce predicciones binarias), y
aplicando primero un umbral a cada modelo individual y agregando después los resultados (lo que genera un apoyo de 0 a 3 votos por localidad).
‘Conjunto con apoyo unánime’ y ‘conjunto con cualquier apoyo’ se refieren, respectivamente, a considerar como presencia únicamente las localidades en las que todos los modelos coinciden, o aquellas en las que al menos un modelo predice presencia.
Solo se incluyeron especies con 20 o menos registros de presencia. Los modelos se ajustaron con datos de entrenamiento y se evaluaron con datos independientes de presencia–ausencia. La línea discontinua indica el mayor rendimiento mediano para cada métrica.
Las cajas representan el rango intercuartílico, con los bordes marcando los cuantiles 0.75 y 0.25, y la línea horizontal indicando la mediana. Los extremos de los bigotes representan los valores mínimos y máximos calculados, y los puntos corresponden a valores atípicos.
Abreviaturas: KDE (kernel density estimation) y ruLSIF (relative unconstrained least‑squares importance fitting).
La modelización de nichos ecológicos afronta un reto clave: ¿cómo obtener #SDM fiables con pocos registros? Un estudio compara #MaxEnt con métodos alternativos y muestra que, cuando los datos disponibles son escasos, el uso de varias opciones puede igualarlo o superarlo:
▶️ doi.org/10.1002/ecog...