Suite

Comment faire des données d'entrée dans MaxEnt avec plusieurs occurrences aux mêmes coordonnées ?


J'ai des données sur les pièges à insectes avec plusieurs centaines d'insectes capturés chaque jour.

Dans cet article, les auteurs disent que « l'exécution du modèle en utilisant le nombre de moustiques par nuit-piège a entraîné un regroupement de fortes probabilités d'occurrence autour des sites de collecte individuels ».

Comment se fait-il qu'ils aient utilisé le nombre de moustiques à un seul emplacement de piège individuel puisque jusqu'à présent, ce que je comprends de Maxent, c'est que vous n'avez besoin que de trois colonnes, occurrence (espèce), x et y ?

Comment faire pour que MAxent prenne en compte le nombre d'insectes au lieu de leur seule présence ?

Je suis très nouveau sur MaxEnt et je ne parviens vraiment pas à résoudre ce problème.


Maxent est censé prédire la probabilité de présence en raison des covariables que vous testez (généralement des variables environnementales). C'est un modèle de présence uniquement et non un modèle d'abondance, donc je ne vois vraiment pas comment le papier que vous avez mentionné utilise le nombre de moustiques (le lien ne fonctionne pas).

Une option consiste bien sûr à dupliquer ce point de présence représenté par une coordonnée x et y autant de fois que vous avez attrapé des moustiques et à manipuler le paramètre de suppression des doublons de MaxEnt. Mais je tiens à vous avertir dès le départ que cela va gâcher le calcul de validation, vous donnant une précision très gonflée. Et bien sûr, c'est une sorte de triche d'utiliser des doublons dans un modèle corrélatif.


Avez-vous essayé de publier ceci sur le groupe Google MaxEnt ? Vous y trouverez peut-être une meilleure réponse.

Quoi qu'il en soit, MaxEnt est uniquement destiné aux données de présence - je ne me souviens pas avoir lu un article où les données de comptage ont été utilisées. Ce qu'ils ont probablement fait, c'est quelque chose comme mettre plusieurs points très proches les uns des autres afin de simuler des données de comptage à un seul endroit. Par exemple, si vous utilisiez une catégorie de végétation comme prédicteur dans votre modèle et que vous l'aviez dérivée de l'imagerie Landsat8, chaque cellule couvrirait 30 mètres sur 30 mètres. Vous pouvez facilement placer plusieurs points dans une zone de 30 mx 30 m, et cela vous donnerait un résultat (je suppose que je n'ai pas testé cela) qui ressemble à l'utilisation de données ponctuelles. Mais, comme vous le soulignez, cela a créé des résultats erronés - c'est-à-dire un regroupement spatial de probabilités élevées. Je ne pense pas que MaxEnt soit conçu pour gérer les distributions de probabilité qui découlent des points d'écoute. Vous pouvez consulter les modèles de processus ponctuels - Renner et Warton ont récemment écrit un excellent article sur la méthode et ont un package R pour cela appelé PPM http://www.inside-r.org/packages/cran/spatstat/docs/ppm . Il existe un certain nombre de bons tutoriels pour vous aider aussi!