Suite

Rasters comme variables indépendantes dans la régression logistique : doivent-ils avoir la même classification de valeurs ?


Je prévois de créer un modèle prédictif de la productivité des terres à l'aide d'arcGIS 10.1. et la régression logistique. Dans mon modèle, les variables indépendantes seraient, entre autres, la distance des rivières, la distance de la source, la distance du littoral.

Je me demande s'il est plus judicieux/utile/essentiel d'utiliser la même classification de valeurs pour les trois rasters susmentionnés, ou s'il ne poserait aucun problème d'un point de vue analytique d'avoir des rasters avec une classification différente.


La régression n'exige pas que toutes les variables soient sur une échelle commune pour être comparées les unes aux autres. Que vous les reclassiez avant d'exécuter l'analyse ou que l'outil d'analyse que vous choisissez vous permette de le faire au sein de l'outil dépend de vous et du choix de l'outil. Vous voudriez bien sûr conserver une copie de toutes les données originales.

Je pourrais suggérer de consulter les fichiers d'aide ArcGIS sur l'analyse de régression à partir d'ici. Il y a aussi un tutoriel lié dans le fichier d'aide.

Quelques ressources supplémentaires :

  • Article ArcUser Online : Trouver un modèle significatif
  • Article pdf ArcUser : Répondre aux questions pourquoi
  • Vidéo de formation Esri : Au-delà de l'endroit : utiliser l'analyse de régression pour explorer pourquoi

Étant donné que je note également que vous mentionnez spécifiquement une régression logistique, vous pouvez également jeter un œil à cette discussion concernant cette méthode qui n'est pas disponible dans ArcGIS sans l'utilisation de R.

Avis de non-responsabilité : je ne suis pas un expert en régression et n'ai fait que quelques analyses simples avec. Ce que je sais provient d'une conférence d'une journée et de ressources de lecture liées ci-dessus et similaires.


Voir la vidéo: Perusanalyysit SPSS (Septembre 2021).