Suite

Du polygone à la mesure continue de la diversité ?


D'abord; J'ai essayé de trouver une question similaire, sans succès. C'est peut-être parce que je suis assez nouveau dans le domaine des SIG et que je ne sais pas vraiment ce que je recherche exactement. Si quelqu'un me signale un problème similaire, je serais heureux de supprimer ce message.

Je dois créer une variable «continue» ou raster (dans de petites cellules de grille) de la diversité de la population pour un pays donné. J'ai un fichier de formes montrant la répartition des groupes ethniques en polygones (fig. 1), et le résultat que je recherche est un « indicateur moyen de diversité » dans chacune des unités administratives (les UA, dans ce cas, le 360 circonscriptions nigérianes).

Fig. 1. Polygones de groupes de population au Nigeria

La solution que j'ai trouvée était d'obtenir le pourcentage de surface de chaque polygone dans chaque UA et de calculer un indice d'hétérogénéité à partir de cela. Mais le problème est que je laisserais de côté pas mal d'informations en raison de la répartition des unités administratives. Comme le montre la fig. 2, les carrés 'a', 'b' et 'c' auraient le même 'indice de ségrégation', mais il est clair qu'ils ne sont pas dans la même position vis-à-vis des 'points chauds'.

Figure 2.

J'ai donc pensé qu'une autre solution pourrait être de créer une carte quadrillée et de calculer la distance jusqu'à la frontière la plus proche, mais encore une fois, partager une seule frontière n'est pas la même chose que d'être dans la partie centrale de la carte, où plusieurs groupes vivent ensemble.

Après avoir trouvé cette question, je suppose que les polygones pourraient être transformés en points à l'aide de leurs centroïdes, puis appliquer la même méthode. Mais la vérité est que je suis nouveau dans ce domaine, et cette question n'est pas vraiment clairement répondue. Comment ai-je pu faire une chose pareille ?

En utilisant un autre exemple, je souhaite créer quelque chose comme ceci (images de ce site Web) :

Étant donné la répartition de certains points avec différentes caractéristiques qualitatives, obtenir une mesure de la diversité à partir de laquelle je pourrais estimer une « hétérogénéité moyenne » de chaque unité administrative.

Comment pourrais-je le faire ? J'utilise R et QGIS, donc cela ne me dérange pas sur quelle plate-forme est basée la solution.


Je donnerais vraiment une chance à SpatiaLite pour y parvenir ! Plus commodément, vous pouvez utiliser le plugin QSpatiaLite dans QGIS.

Configurez simplement une grille de polygones avec une taille raisonnable pour les cellules de la grille. Ensuite, coupez la grille avec le polygone du groupe ethnique et calculez l'aire de chaque intersection. Avec le tableau résultant, vous pouvez calculer vos indices en utilisant les zones d'intersection, qui sont des zones de groupes ethniques dans chaque cellule de la grille, comme « métrique d'abondance » (c'est ainsi qu'un écologiste l'appellerait) !

En supposant que votre couche de groupes ethniques s'appelle 'EthnicGroups', avec un champ 'group' et que la grille de polygones s'appelle 'Grid' avec un champ 'ID', cette requête SQL s'appliquerait :

SELECT g.ID AS gID, e.group AS egr, AREA(INTERSECTION(e.geometry, g.geometry)) AS egr_area FROM Grid AS g JOIN EthnicGroups AS e ON INTERSECTS(g.Geometry, e.Geometry) ORDER BY gID , egr_area ASC

Pour calculer les métriques de diversité avec des formules spéciales, j'utiliserais R, en réduisant ces « abondances », en donnant une valeur pour chaque cellule de grille, qui pourrait enfin être jointe à vos géométries de grille !

Pour obtenir votre diversité moyenne pour chaque AU, vous pouvez utiliser les indices de diversité que vous avez joints à la grille. Encore une fois en utilisant SpatialLite en regroupant les valeurs dans les polygones AU avec l'application de la fonction moyenne.

C'est marrant que je viens d'écrire un article de blog sur ce sujet, qui pourrait vous donner une idée : http://thebiobucket.blogspot.co.at/2014/12/usecase-find-dominant-species-and.html

En ce qui me concerne, je conseillerais de sauter l'idée de « continuité » à cet égard, car la diversité n'a de sens que par rapport à l'unité spatiale sur laquelle elle repose. Je pense donc que toutes les approches et techniques sophistiquées qui utilisent n'importe quelle sorte de moyenne ou d'interpolation sur d'autres unités que les unités spatiales sur lesquelles reposent vos indices n'ajouteront rien de précieux, mais obscurciront plutôt le résultat !

Voici une carte montrant la diversité amphibie (plutôt qu'ethnique) pour laquelle j'ai utilisé à peu près la même méthode :

ps : Ce lien peut être intéressant si vous souhaitez obtenir de la diversité dans un rayon de recherche donné !


Dans QGIS, vous pouvez générer une grille de points au-dessus de vos polygones. Vous trouverez cette fonction sous Vecteur -> Outils de recherche (je pense que cela s'appelle en anglais, ma version QGIS est dans une autre langue.) Vous devrez trouver une granularité raisonnable en ce qui concerne l'espacement de la grille de points.

Ensuite, dans le menu Vecteur, vous effectuez une jointure des attributs par emplacement (trouvée sous Gestion des données) en utilisant les points comme cible et les polygones d'ethnicité comme source.

Vous avez maintenant une grille de points avec un attribut d'ethnicité pour chaque point.

C'est là que ça devient un peu délicat. Vous pouvez générer un raster en utilisant ces points, si vous recodez votre attribut en une valeur numérique (par exemple en utilisant l'outil Créer un champ numérique équivalent dans la boîte à outils de traitement QGIS.) Vous pouvez ensuite utiliser Créer une grille sous Raster -> Analyse. Ici, vous pouvez peut-être expérimenter l'analyse de la moyenne glissante ou du plus proche voisin. Ensuite, vous pouvez utiliser les statistiques zonales (il existe un certain nombre d'options dans la boîte à outils de traitement, ainsi que dans le menu raster.)

L'astuce est de savoir comment obtenir l'index d'hétérogénéité tout en ignorant la valeur arbitraire créée en recodant les attributs dans un index numérique, mais vous pourriez avoir une idée de la vôtre ici. Je ne sais pas trop comment m'y prendre sans prendre trop de temps par rapport à ce que je suis censé faire en ce moment :)

Une autre idée est de charger votre grille de points dans une base de données Spatialite (ou PostGIS, mais c'est une opération plus importante à exécuter.) Ensuite, vous pouvez utiliser SQL et des fonctions spatiales dans la base de données pour tester tous les points dans un rayon défini de chaque point à donnez-lui un indice de variance local, puis générez un raster à partir de cette valeur. J'ai travaillé un peu avec ça récemment.

J'espère que cela vous donnera des idées ! N'hésitez pas à utiliser les commentaires si vous souhaitez en discuter davantage.


Il y a un certain nombre d'hypothèses dans votre question qui doivent être abordées avant d'aborder la question de la mise en œuvre. L'exemple que vous fournissez est une analyse de la biodiversité basée sur un échantillon de variétés d'une espèce végétale donnée. J'ai regardé le manuel du logiciel qui a été utilisé pour générer ce raster, et rien n'indique que cela est approprié ou a été appliqué aux populations humaines. Le centroïde d'une aire culturelle humaine (que vous proposez d'utiliser pour votre analyse) n'est en aucun cas analogue à un échantillon (c'est-à-dire une observation réelle) d'une collection de plantes.

La proximité des sous-groupes humains (divisés selon n'importe quelle dimension, ici la dimension est l'ethnicité) peut être exprimée comme une mesure de diversité ou une mesure de ségrégation. Une mesure de diversité largement utilisée est l'indice de Herfindahl, qui varie de 0 à 1 et est petit lorsqu'une zone a de nombreux petits groupes et grand lorsqu'une zone a de nombreux grands groupes. Il est calculé au sein d'une population ou d'une zone sans référence à quoi que ce soit en dehors de cette population ou zone. Ceci est problématique car vous êtes intéressé par l'interaction spatiale à travers les frontières administratives.

Une mesure de ségrégation largement utilisée est l'indice de dissemblance, qui varie de 0 à 1 et est petit lorsque les sous-zones ont la même distribution de population que la grande région, et grand lorsque les sous-zones sont exclusivement un groupe ou un autre. Il est généralement calculé dans une région pour laquelle des informations démographiques sont disponibles pour de nombreuses sous-zones (par exemple, vous pouvez calculer l'indice de dissemblance Noir-Blanc pour la région métropolitaine sur la base des données démographiques de tous les secteurs de recensement de la région métropolitaine). Wong (2002) a modélisé local ségrégation en calculant l'indice de dissemblance pour chaque sous-zone en fonction de la population des sous-zones voisines (c'est-à-dire contiguës) plutôt que de la région dans son ensemble. Une limitation de cette mesure est qu'elle ne peut fonctionner que pour deux groupes à la fois. Cependant, je l'ai utilisé dans mes propres recherches en utilisant les deux groupes les plus peuplés au sein de chaque zone de voisins.

Vous avez indiqué que vous souhaitez calculer la diversité pour chaque unité administrative (UA). Mais vous dites aussi que vous devez créer une trame continue de diversité. Je ne sais pas si vous voulez réellement un raster continu de diversité ou si vous pensez en avoir besoin pour calculer la diversité AU. Si vous voulez en fait une diversité continue, je vous recommande de jeter un œil à O'Sullivan & Wong (2007), qui visualise la diversité continue à l'aide d'un estimateur de densité à noyau. Cela a pour effet de tenir compte de l'interaction de la population à travers les frontières administratives, ce que vous indiquez que vous voulez.

OTOH, si vous voulez vraiment de la diversité par unité administrative, vous pouvez le faire en utilisant soit l'indice de Herfindahl, soit l'indice local de dissemblance. Mais cela nécessite des informations sur les caractéristiques démographiques au sein de chaque UA. Je suppose que la raison pour laquelle vous utilisez la carte des zones ethniques est que vous n'avez pas de données sur la population ethnique pour les UA. Mais si vous connaissez la population de chaque UA et que vous la croisez avec la grille des zones ethniques, vous pouvez allouer la population des UA aux zones ethniques. L'hypothèse importante de cette réponse et des autres réponses proposées jusqu'à présent est qu'elles supposent que la densité de population est constante dans l'ensemble de l'UA ou de la zone ethnique. Cette hypothèse semble à première vue invraisemblable, mais vous connaissez les données mieux que moi et pouvez être à l'aise avec cette hypothèse.

Sur la base de ma compréhension de vos objectifs, je pense que mon approche serait la suivante :

  1. Modèle de population au sein de sous-unités où les sous-unités peuvent être l'intersection d'UA et de zones ethniques, ou une grille vectorielle ou raster. Avec suffisamment de temps, je voudrais l'essayer dans les deux sens.
  2. Calculez l'indice d'Herfindahl pour chaque UA, mais, à la suite de Wong (2002), je calculerais l'indice d'Herfindahl en fonction du voisinage de chaque UA plutôt que simplement de la population au sein de l'UA. Avec suffisamment de temps, j'expérimenterais à la fois des quartiers basés sur la contiguïté et sur la distance.

Bien sûr, rien de tout cela n'arrive à la mise en œuvre technique, mais si vous me donnez des commentaires à ce sujet, nous pouvons passer à autre chose.

PS : Les articles universitaires auxquels je suis lié sont fermés. Si OP n'a pas accès à une bibliothèque universitaire, n'hésitez pas à me contacter par e-mail et je vous les fournirai.


Comment se rapproche du traitement de données géospatiales à grande échelle ?

L'intelligence de localisation est un outil très puissant permettant aux entreprises de comprendre le comportement des consommateurs grâce à des signaux du monde réel tels que les heures de circulation, la richesse, le mode de vie, etc. Cette intelligence exploitable peut être utilisée pour segmenter, cibler et mieux impliquer les consommateurs dans toutes les catégories. La géolocalisation permet également de mesurer facilement les performances des efforts marketing grâce à l'attribution de la fréquentation des magasins.

Le volume de données de localisation a considérablement augmenté au cours des deux dernières décennies, ce qui présente plusieurs défis en ce qui concerne le stockage, le traitement et l'obtention de renseignements exploitables. Avec cette augmentation exponentielle, les systèmes informatiques autonomes sont incapables de gérer ces données avec leur capacité limitée de traitement et d'analyse à grande échelle. Actuellement, les quelques solutions disponibles pour traiter les mégadonnées géospatiales ont des protocoles de mise en œuvre complexes et ont une capacité d'intégration limitée avec des cadres géospatiaux variés.

La diversité des données géospatiales

Les données géospatiales sont au cœur de l'analyse du comportement des personnes et des lieux et de la détermination de la relation entre les deux. Les données géospatiales consistent en des informations sur un lieu en termes de localisation et d'autres attributs associés.

Contrairement à d'autres jeux de données, il ne prend que trois formes de structure standard, à savoir le point, la ligne et le polygone.

  • Une donnée de point stocke des informations de coordonnées uniques avec d'autres attributs tels que le nom, l'adresse, etc.
  • Une ligne est une série de coordonnées pour stocker des informations sur l'espace ainsi que d'autres attributs d'entités telles que la route, la rivière, la voie ferrée, etc.
  • Un polygone stocke les informations d'une surface continue sous la forme des coordonnées qui la délimitent et d'autres attributs.

L'image ci-dessous illustre la coexistence des trois formats de données avec des représentations différentes. Le point peut contenir des informations telles que des coordonnées pour le placer sur une carte, le nom de la banque qu'il représente, et peut-être l'adresse. De même, le polygone peut fournir des informations sur le nom du bâtiment, le nom de la banque, le nombre d'étages, etc. tandis que la ligne peut fournir des informations sur le nom de la route, la largeur de la route et s'il s'agit d'une rue à sens unique. , etc.

Une carte affichant les trois formes de données vectorielles spatiales et leur relation les unes avec les autres sur la carte. Leur relation les uns avec les autres joue un rôle important dans l'association d'un formulaire de données à un autre et l'ajout d'informations d'attribut significatives les unes aux autres.

Aujourd'hui, les consommateurs génèrent une énorme quantité d'informations sous forme de points représentant des restaurants, des centres commerciaux, des centres commerciaux, etc. et émettent en continu de nombreux pings de localisation via GPS lorsqu'ils se déplacent avec leurs appareils mobiles. De plus, les bâtiments ne sont pas de simples points sur une carte et plusieurs polygones peuvent représenter la forme et la superficie appropriées d'un bâtiment. Lorsqu'on travaille au niveau géographique d'un pays, la taille des données spatiales et la complexité des opérations de données dépassent la capacité des systèmes informatiques actuels et des logiciels dédiés.

Pourquoi travailler avec des données géospatiales à grande échelle est un défi ?

Considérons le scénario, où nous avons ces trois ensembles de données dans différents fichiers, et nous voulons savoir dans quel polygone se trouve le point de l'université et à quelle distance se trouve le bord le plus proche de la route. Une fois que nous avons les attributs du polygone qui lui est associé, la superficie de l'université, la distance entre la porte de l'université et la route et d'autres informations peuvent être facilement associées aux données ponctuelles. Toutes ces opérations nécessiteront une solution de géométrie de coordonnées à deux dimensions pour trouver l'association entre elles. C'est une tâche ardue qui prendrait beaucoup de temps et est difficile à paralléliser sur un système informatique distribué.

La tâche devient ardue avec l'augmentation du volume des données à un point tel qu'elles ne peuvent pas être gérées par le logiciel de bureau SIG dédié ou les environnements de travail SIG sur des machines autonomes. Le besoin de l'heure est de proposer des solutions flexibles et évolutives pour gérer le traitement des données spatiales. Au cours des dernières années, un développement et des efforts actifs ont été déployés pour trouver des solutions permettant de traiter et d'interroger les données spatiales rapidement et à grande échelle. Quelques exemples de plates-formes et d'API qui permettent des requêtes et des opérations géospatiales à grande échelle sont Geospark, Geomesa et Hadoop-GIS. En outre, un plus grand nombre de banques de données SQL, ainsi que NoSQL, sont désormais disponibles pour fournir une prise en charge d'une gamme limitée à une large gamme de requêtes spatiales sur les données géospatiales.

Le défi avec les magasins de données est l'évolutivité du processus. Ils ne peuvent pas effectuer la tâche qui leur est confiée en parallèle sur les données, bien qu'ils soient riches en fournissant un certain nombre d'opérations géospatiales telles que des jointures spatiales, des calculs de distance, des superpositions spatiales, etc. D'autre part, les plateformes de big data géospatiales fournissent un nombre limité des opérations spatiales mais accélèrent considérablement le processus. Ces plates-formes nécessitent également une configuration et un environnement uniques qui ne sont pas faciles à mettre en œuvre et qui augmentent également le coût car vous ne pouvez pas utiliser les plates-formes de traitement de données volumineuses existantes comme Spark.

Comment résolvons-nous le problème de près ?

La plate-forme Near utilise le framework de calcul distribué pour gérer les mégadonnées géospatiales à grande échelle avec une intégration et une configuration flexibles. Near traite plus de 10 To de données par jour et fonctionne avec des millions de données de points et de polygones. Des efforts constants de recherche et de développement sont déployés pour traiter de grandes quantités de ces données afin de répondre aux attentes des clients.

La plate-forme Near exploite la puissance de l'informatique distribuée (Spark) avec une configuration efficace sans affecter l'utilisation dédiée de la plate-forme pour l'utiliser pour résoudre le problème du traitement des mégadonnées géospatiales. Par exemple, pour traiter une simple analyse de proximité à l'aide d'un environnement Python standard pour trouver le polygone le plus proche à partir d'un million de points et de quelques millions de polygones, cela prend plusieurs heures. Mais avec l'environnement Spark configuré et l'utilisation de packages et de fonctions géospatiaux standard en Python, le même exercice prend environ 1/30e du temps. L'utilisation d'un environnement Python pour définir la logique de fonctionnement géospatial offre une flexibilité (un bac à sable) et l'utilisation de Spark en parallèle crée une combinaison puissante. Non seulement cela, cela nous permet également d'intégrer la puissance des magasins de données comme MongoDB et d'accélérer encore plus la vitesse de traitement dans une large mesure. Dans un autre exemple, le calcul des centroïdes de dizaines de millions de polygones avec le calcul distribué prend quelques minutes alors qu'une machine autonome aurait pris plusieurs heures pour la tâche. Nous veillons à ce que le format géométrique soit flexible et convertible du texte à un objet de forme et vice versa. De plus, lorsque vous travaillez sur des données géospatiales, l'indexation spatiale est extrêmement importante et la plate-forme Near l'exécute méticuleusement.

Dériver une intelligence exploitable est notre travail quotidien

Une grande attention est accordée au développement d'une plate-forme de requêtes et d'opérations de mégadonnées géospatiales, mais une solution bien établie pour être utilisée est encore à un pas. Les solutions existantes ne sont pas simples à mettre en place ni personnalisables, mais sont dédiées aux données géospatiales et prennent en charge les opérations directes de « lecture et écriture » depuis son environnement.

Chez Near, nous exploitons la puissance des plates-formes Big Data existantes telles que Spark avec des étapes de configuration efficaces pour apporter rapidité et efficacité au processus. L'utilisation de packages et de fonctions Python pour travailler sur les données géospatiales dans l'environnement Python et le stockage des données dans l'environnement Spark sous forme de texte simplifie la tâche complexe de traitement de données à grande échelle. Cela nous aide à accélérer le traitement d'énormes quantités de données géospatiales pour obtenir des informations exploitables pour nos clients.


Qu'est-ce qu'un centre de données et comment fonctionne-t-il ?

À la base, un centre de données est un emplacement centralisé qui abrite l'équipement informatique et réseau requis pour collecter, stocker, traiter et distribuer de grandes quantités de données. Les installations du centre de données sont également essentielles pour fournir un accès aux grandes quantités de données qui y sont stockées pour les employés exécutant des opérations quotidiennes, des applications et d'autres processus dans un environnement de cloud computing.

Les centres de données modernes se composent d'une variété de composants d'infrastructure, y compris des serveurs et des équipements de connectivité réseau, qui permettent d'accéder au stockage du serveur via Internet. Les utilisateurs, qu'ils utilisent un centre de données privé ou un centre de données partagé, accèdent aux données et aux programmes hébergés sur l'équipement du centre de données via Internet pour effectuer les opérations quotidiennes. Dans un environnement de cloud public, les centres de données partagent des capacités de calcul et de stockage avec un large groupe d'utilisateurs. Les paramètres de cloud privé, à l'inverse, limitent l'accès à l'architecture du centre de données à un seul utilisateur dédié.

Qu'est-ce qui constitue un centre de données ? Les composants de base

La conception des centres de données varie souvent en fonction des fournisseurs de cloud offrant le service et/ou des besoins des entreprises clientes individuelles. Indépendamment des cas individuels, l'infrastructure du centre de données comprend généralement des routeurs, des commutateurs, des pare-feu, des systèmes de stockage, des serveurs et des contrôleurs de livraison d'applications. Ces composants fonctionnent ensemble pour fournir un accès aux applications prenant en charge les opérations commerciales et répartir les charges de travail sur une variété de machines pour assurer un fonctionnement efficace. Dans son ensemble, l'infrastructure d'un centre de données offre aux utilisateurs :

  • Infrastructure réseau pour connecter les serveurs du centre de données (à la fois physiques et virtualisés), les services, le stockage et la connectivité externe aux utilisateurs finaux.
  • Infrastructure de stockage dédiée au stockage et à la gestion des données dont les utilisateurs ont besoin pour les opérations quotidiennes.
  • Les serveurs traitent, fournissent de l'espace mémoire, un stockage local et une connectivité réseau qui pilotent les applications pour les entreprises.

Comment entretenir un centre de données ?

L'efficacité de tout centre de données, d'un centre de données de cloud privé à un centre de données d'entreprise, se résume à une maintenance appropriée. Cela comprend la maintenance de l'infrastructure physique qui constitue le centre de données, ainsi que le bâtiment et ses systèmes. Alors que de plus en plus d'entreprises se tournent vers des installations de colocation pour l'infrastructure des centres de données, il est essentiel de comprendre comment les fournisseurs de cloud maintiennent les centres de données.

La maintenance de l'équipement du centre de données peut généralement être divisée en une poignée de catégories qui incluent des inspections régulières, des tests continus, une maintenance prédictive, une maintenance préventive et une maintenance corrective. Les fournisseurs doivent effectuer des inspections quotidiennes au cœur de leurs opérations de maintenance pour s'assurer que tout dans les installations de colocation fonctionne correctement. Cela inclut les systèmes de distribution électrique et mécanique, ainsi que les infrastructures électriques telles que les générateurs de secours qui assurent des systèmes d'alimentation et de refroidissement sans interruption qui empêchent les serveurs de surchauffer.

D'autres formes d'entretien nécessitent des vérifications quotidiennes, hebdomadaires et mensuelles. Des tests continus, par exemple, sont effectués pour s'assurer que l'équipement et les systèmes du centre de données fonctionnent selon les paramètres appropriés. La maintenance prédictive consiste en une analyse des données qui permet de prévoir les défis à venir ou les défaillances potentielles afin d'éviter les problèmes. La maintenance préventive garantit que les serveurs et autres éléments de l'architecture du centre de données sont remplacés à intervalles réguliers pour éviter les interruptions du réseau. La maintenance corrective est une option de dernier recours qui nécessite de réparer rapidement tous les systèmes qui ont échappé aux programmes de maintenance ci-dessus et ont échoué de manière inattendue.


Du polygone à la mesure continue de la diversité ? - Systèmes d'information géographique

Outils de modélisation des niches et des distributions d'espèces

Ce package est un complément au package dismo populaire pour R par Robert Hijmans. Il contient une suite de fonctions d'efficacité pour préparer des données, former et évaluer des modèles de distribution d'espèces et des modèles de niche écologique, et comparer des niches écologiques.

Vous pouvez installer ce package dans R en utilisant ces commandes :

Remarque : Si, pour une raison quelconque, ces commandes ne fonctionnent pas, vous pouvez installer le(s) package(s) en téléchargeant le dernier fichier zip/tar à partir du répertoire zipTarFiles et en installant le(s) package(s) manuellement. Si vous faites cela, vous devrez également installer les packages omnibus , statisfactory et légendaire , qui se trouvent également sur GitHub sous mon compte ( adamlilith ).

  • elimCellDups : Élimine les points en double dans chaque cellule d'un raster
  • geoFold : Générer des plis k géographiquement distincts
  • geoThin et geoThinApprox : Points géographiquement minces
  • trainByCrossValid : Wrapper pour implémenter une fonction trainXYZ à travers les plis de validation croisée (voir aussi summaryByCrossValid ).
  • trainBrt : Arbres de régression boostés (BRT)
  • trainCrf : Arbres de régression conditionnelle (CRF)
  • trainGam : Modèles additifs généralisés (GAM)
  • trainGlm : Modèles linéaires généralisés (GLM)
  • trainGlmDredge : Modèles linéaires généralisés (GLM)
  • trainLars : Modèles de régression aux moindres angles (LARS)
  • trainMaxEnt et trainMaxNet : modèles Maxent
  • trainNs : Splines naturelles (NSs)
  • trainRf : Forêts aléatoires (RF)
  • aucWeighted : AUC (avec/sans poids de site)
  • aucMultiWeighted : version multivariée de l'AUC (avec/sans poids du site)
  • contBoyce : Indice de Boyce continu (avec/sans poids de site)
  • contBoyce2x : version "2X cover" de l'indice Continuous Boyce (avec/sans poids de site)
  • fpb : mesure Fpb de la capacité de discrimination du modèle (avec/sans poids de site)
  • seuilWeighted : seuils pour convertir les prédictions continues en prédictions binaires (avec/sans poids de site)
  • seuilStats : statistiques de performance du modèle basées sur des prédictions seuillées (avec/sans poids de site)
  • tssWeighted : True Skill Statistic (TSS) (avec/sans pondération du site)
  • modelSize : nombre de valeurs de réponse dans un objet de modèle
  • compareNiches : métriques de chevauchement de niche
  • compareResponse : compare les réponses du modèle de niche à une seule variable
  • mop : Calculer la parité orientée mobilité, une mesure de distance multivariée selon Saupe et al. 2012.
  • nicheOverlap : Calculez le chevauchement des niches selon Broennimann et al. Écologie mondiale et biogéographie 21:481-497
  • randPointsRespectingSelf : Randomiser les points géographiques tout en respectant approximativement la structure d'autocorrélation spatiale observée entre les points
  • randPointsRespectingSelfOther2 : randomiser deux ensembles de points géographiques tout en respectant approximativement la structure d'autocorrélation spatiale observée entre et dans les ensembles
  • randPointsBatch : appelez randPointsRespectingSelf ou randPointsRespectingSelfOther2 plusieurs fois
  • randPointsBatchExtract : extrait l'environnement d'un ensemble de rasters pour des ensembles de points aléatoires générés à l'aide de randPointsBatch
  • randPointsBatchSampled : Rassemblez tous les ensembles de points aléatoires générés à l'aide de randPointsBatch
  • randPointsBatchNicheOverlap : calcule le chevauchement de niche entre des ensembles de points aléatoires générés à l'aide de randPointsBatch
  • spatialCorrForPoints : calcule la mesure par paires basée sur la distance de l'autocorrélation spatiale globale entre les points géographiques
  • spatialCorrForPointsSummary : Taille de cluster caractéristique des points spatiaux (distance d'autocorrélation globale)
  • spatialCorrForPointsPlot : tracer les distributions observées et nulles de la mesure par paires basée sur la distance de l'autocorrélation spatiale globale
  • spatialCorrForPointsWeight : attribuez des poids aux points en fonction de la mesure par paires basée sur la distance de l'autocorrélation spatiale globale
  • bioticVelocity : Vitesse de déplacement à travers une série de rasters
  • interpolateRasters : Interpoler une pile de rasters
  • longLatRasters : génère des rasters avec des valeurs de longitude/latitude pour les valeurs de cellule
  • rastWithSquareCells : Créer un raster avec des cellules carrées à partir d'un objet avec une étendue
  • sampleRast et sampleRastStrat : Echantillon raster avec/sans remplacement et éventuellement de manière stratifiée
  • squareRastCells : rééchantillonne un raster pour que les cellules soient carrées

Aire de répartition basée sur des polygones convexes minimum

  • mcpFromPolygons : Polygone convexe minimum à partir d'un ensemble de polygones et points
  • areaFromPointsOrPoly : Aire d'un polygone spatial ou d'un ensemble de points

Fonctions d'utilité géographique

  • convertTropicosCoords : Convertir les coordonnées de la base de données TROPICOS
  • coordPrecision : calcule la précision de coordonnées maximale possible
  • decimalToDms : convertit la coordonnée décimale en degrés-minutes-secondes
  • dmsToDecimal : convertit la coordonnée degrés-minutes-secondes en décimal
  • getCRS : Renvoie une chaîne proj4 (chaîne du système de référence de coordonnées) à l'aide d'un pseudonyme
  • getEPSG : Renvoie un code EPSG (coordinate reference system codeg) à l'aide d'un pseudonyme
  • pointDist : Distance géographique entre ensemble(s) de points
  • xToCoords : extraire les coordonnées géographiques d'un bloc de données, d'une matrice ou d'un objet SpatialPoints*

En octobre 2020, il n'y avait pas de publication spécifique au package pour enmSdm , mais le package a été utilisé et cité pour la première fois dans :

Morelli*, TL, Smith*, AB, Mancini, AN, Balko, EA, Borgenson, C., Dolch, R., Farris, Z., Federman, S., Golden, CD, Holmes, S., Irwin, M ., Jacobs, RL, Johnson, S., King, T., Lehman, S., Louis, EE Jr., Murphy, A., Randriahaingo, HNT, Lucien, Randriannarimanana, HLL, Ratsimbazafy, J., Razafindratsima, OH , et Baden, AL 2020. Le sort de l'habitat de la forêt tropicale de Madagascar. Nature Changement Climatique 10:89-96. * Contribution égale https://doi.org/10.1038/s41558-019-0647-x

Abstrait. Madagascar a connu une déforestation et une surexploitation extensives, et le changement climatique anthropique aggravera ces pressions. Anticiper ces menaces pour les espèces menacées et leurs écosystèmes nécessite de prendre en compte à la fois le changement climatique et les effets de la perte d'habitat. Le genre Varecia (lémurs varis), qui est composé de deux espèces forestières obligatoires en danger critique d'extinction, peut servir d'indicateur de l'état de la forêt tropicale humide de l'est de Madagascar, riche en biodiversité. Ici, nous avons combiné des décennies de recherche pour montrer que l'habitat convenable pour les lémuriens varis pourrait être réduit de 29 à 59 % à cause de la déforestation, de 14 à 75 % à cause du changement climatique (voie de concentration représentative 8.5) ou de 38 à 93 % des deux d'ici 2070. Si les aires protégées actuelles évitent une nouvelle déforestation, le changement climatique réduira toujours l'habitat convenable de 62 % (plage : 38-83 %). Si la déforestation en cours se poursuit, l'habitat convenable diminuera de 81 % (plage : 66-93 %). Le maintien et l'amélioration de l'intégrité des aires protégées, où les taux de perte de forêt sont plus faibles, seront essentiels pour assurer la persistance de la diversité des forêts tropicales malgaches en déclin rapide.


Développer et utiliser des graphiques de carte

.. étapes pour développer des graphiques cartographiques et une analyse visuelle des zones de marché/d'étude .. les graphiques cartographiques sont une partie importante de la plupart des analyses démographiques et économiques et sont essentiels pour de nombreuses applications. Non seulement les cartes sont nécessaires pour montrer les limites géographiques et l'emplacement relatif de la géographie dans une zone plus large, mais elles peuvent prendre vie en montrant des modèles. Une carte thématique du revenu médian des ménages par groupe d'îlots est un bon exemple. Les zones de prospérité économique les plus élevées et les plus faibles par quartier peuvent être immédiatement déterminées. Les graphiques cartographiques peuvent améliorer notre capacité à communiquer des informations complexes. Transmettez les informations plus rapidement. Faites des présentations plus convaincantes. Collaborez plus efficacement grâce à l'utilisation de graphiques cartographiques. Voir la section Web connexe pour plus de détails.

L'objectif de cette section est de créer et d'utiliser des fichiers KML pour préparer des graphiques cartographiques à utiliser dans le développement de rapports d'analyse comparative de zone d'étude de marché. Ces fichiers et graphiques cartographiques ont également des utilisations plus larges. Les étapes sont passées en revue pour développer les fichiers graphiques de carte de zone circulaire KML, les convertir en structure de fichiers de formes et intégrer les deux fichiers dans les applications cartographiques et SIG et les mettre en service.

Les fichiers KML (Keyhole Markup Language) sont des fichiers structurés XML utiles pour visualiser des objets géographiques (comme des cercles) à l'aide de navigateurs Internet, notamment Google Earth. Pourquoi développer/utiliser des fichiers KML ? Ils sont faciles à créer avec précision, il y a peu ou pas de courbe d'apprentissage, ils peuvent être utilisés dans de nombreux lieux et ils sont libres de se développer. Les fichiers KML peuvent être utilisés côte à côte avec des fichiers de formes. Les fichiers de formes, structurés très contrairement aux fichiers KML, sont la structure de fichiers vectorielle dominante utilisée dans les applications SIG impliquées à la fois dans la visualisation et l'analyse géospatiale.

Développement de fichiers KML circulaires et de graphiques cartographiques
Une “vue objective” de cette section est illustrée dans le graphique suivant. Le graphique montre l'emplacement d'un site d'étude (marqueur rouge), des cercles de rayon de 1 mile et 3 miles. L'emplacement du site est un Starbucks situé au 302 Nichols Road, Kansas City, MO 64112. La vue montre un graphique circulaire basé sur KML dans le contexte des modèles de revenu médian des ménages par groupe de blocs. Développez des vues similaires pour n'importe quelle zone, n'importe quelle configuration circulaire de site, en suivant les étapes décrites dans cette section.

– vue développée à l'aide de CV XE GIS

Création du fichier graphique circulaire KML
Proceed through the next steps to develop a KML file used to create the graphic below on left — a Starbucks located at 302 Nichols Road, Kansas City, MO 64112. Graphic on the right is a Starbucks location in Paris, used to illustrate this process works globally. Both graphics include study area center point and 1-mile and 3-mile radius circles.

302 Nichols Road, Kansas City, MO 64112
23 Avenue de Wagram, 75001 Paris, France

Start the create KML file application
• Key in address 302 Nichols Road, Kansas City, MO 64112 to Google Maps
.. see the latitude-longitude (39.041548,-94.592965) in the URL bar.
• Open this web page to create the circles & save results as KML file.
• Refresh this page if making a new KML file.
• Set the colors and lines to medium, blank and clear.
• Enter coordinates — key in lat 39.041548 and lon -94.592965
.. these for for this example
.. enter the values for your location of interest
Add center point
• In the Radius Distance, key in 0.05 miles
• Click Draw Radius blue button (at right of longitude).
Add site 1 circle
• In the Radius Distance, key in 1.00 miles (use preferred radius for inner circle).
• Click Draw Radius blue button (at right of longitude).
Add site 2 circle
• In the Radius Distance, key in 3.00 miles (use preferred radius for inner circle).
• Click Draw Radius blue button (at right of longitude).
View study area geography
• Optionally navigate up to the map view and make the view similar to the graphic at the top of this page
.. this step is not required but might be useful to verify the study area appearance.
Save KML file
• Navigate down the page to “Google Earth KML Output”. Click the blue button Generate KML.
• Click “Download KML file Here.” Save the file to a folder and make a note of the file path and name
.. save the file as c:sitereport302nichols.kml (this file and filename are used below).
Terminé
• The three part KML file has been created and saved to the local computer.
• Finished using this browser application.

This same process may be used again to create similarly structured KML files of any radius about any point for any location in the world.

Loading a KML file into Google Maps
Optionally create the objective map graphic using the following steps. Or, the KML file may be used with the CV XE GIS software (see below) enabling yet further analytical possibilities.

• Click this link to start the Google MyMaps application.
• When the new page opens click create new map button
• Next click import button
• Enter the file path/name as created above (c:sitereport302nichols.kml), or any KML file.
• Edit the MyMaps rendering to achieve preferred view.
• Use preferred screen capture tool to save that part of the map view as a graphic for the study report.

Using the KML File with an Existing GIS Project and converting the KML file to shapefile structure

1. Add the KML file to an Existing CV XE GIS Project
• Start the CV XE GIS software and open the project file c:cvxe1cvxe_us2.gis (distributed with installer).
.. uncheck Locations and $MHI x BG layers in legend panel.
• Click the AddLayer button (second button from left on toolbar)
• Select the KML file that was created above (c:sitereport302nichols.kml) .. circles appear in the map window.
• Use LayerEditor to adjust settings for KML layer (transparent, bold outline)
• Navigate to zoom-in view and smaller map window.
• Use Toolbar button Save to Image (button 7 from left) to save the map window view to a .jpg file.

2. Converting a KML File to a Shapefile
This step requires the CV XE GIS Basic or higher level version. After the KML layer appears in the above sequence, proceed as follows:

• Click File>ExportShapefile.
• Select the KML layer name.
• Set Coordinate System edit box value to NAD83.
• Click OK button.
• On the Export Layer/FileSave dialog, select an output file path and name.
• The shapefile is generated and may be reused with any GIS project.

3. Editing attributes of the study area shapefile and project file
There are three shapes in the shapefile (center point, circle 1, circle 2).
Modify the appearance of these shapes/objects by using the Select tool (mouse in Select mode).
• In legend panel click on circles layer name turns blue indicating this is the active layer.
• In the map window, click in the circle the profile/editor appears (pop-up)
• Initially all three shapes have the name “Polygon”.
.. change the object names successively to Point1 (the small circle), Circle1 and Circle2.
• The shapefile attributes have been permanently changed.
• When each shape/object has been renamed, use the LayerEditor to modify the appearance of each shape.
.. the changes modify the project file and not the shapefile.
.. optional save the project (overwriting the former version) or save the project with a new name.

Renaming a shape to “Point1”
Click for larger view

Using LayerEditor to set attributes of the study area layer
Click for larger view

View of final study area layer in context of broader project
Click for larger view

View as above with $MHI x BG checked on/visible
Click for larger view

Join me in a Data Analytics Lab session to discuss more details about accessing and using wide-ranging demographic-economic data and data analytics. Learn more about using these data for areas and applications of interest.


Introduction to CDP forests reporting guidance

CDP’s 2018 forests questionnaire seeks to achieve the following:

  • Provide a logical structure that guides companies through the journey of removing commodity-driven deforestation from their value chain and improve their understanding of deforestation-related risks
  • Facilitate greater and more robust disclosure while reducing reporting burden, where possible
  • Provide structured disclosures that allow, to the extent possible, the automation of the forests scoring methodology
  • Produce responses that lend themselves to effective engagement between external stakeholders and companies, allow companies to demonstrate progress and good practice, and allow stakeholders to identify and engage with companies that do not take action.
  • Gather data on deforestation and degradation of forests, as well as other natural ecosystems that provide important ecological services, e.g. natural grasslands, savannas and wetlands.

CDP’s approach to reporting on commodity driven deforestation risk

At present, CDP relies on relevant reporting principles from the Greenhouse Gas Protocol (hereafter referred to as the GHG Protocol) to guide organizations reporting on deforestation risk related to the production or use of the forest risk commodities: timber products, palm oil, cattle products, and soy.

Application of GHG Protocol Principles

While various tools, methodologies, and initiatives have emerged to assist companies to report on deforestation risk related to forest risk commodities such as palm oil, soy and timber, no dominant methodology has yet been adopted. Therefore, widely-used sustainability standards such as the GHG Protocol, can be applied to the field of reporting on forest risk commodities. Where appropriate, this guidance incorporates definitions and approaches established by these bodies.

The GHG Protocol outlines five principles to ensure a true and fair account of a company’s GHG emissions. CDP suggests that all of these principles be adopted for the purpose of reporting on forest risk commodities. These principles are as follows:

  • Relevance: Ensure the commodity use inventory appropriately reflects actual commodity production or use and serves the decision-making needs of users – both internal and external to the company.
  • Completeness: Account for and report on all activities with the potential for deforestation risk within the chosen inventory boundary. Disclose and justify any specific exclusion(s).
  • Consistency: Use consistent methodologies to allow for meaningful comparisons of company’s use of forest risk commodities over time.
  • Transparency: Address all relevant issues in a factual and coherent manner, based on a clear audit trail. Disclose any relevant assumptions and make appropriate references to the accounting and calculation methodologies and data sources used. Transparently document any changes to the data, inventory boundary, methods, or any other relevant factors in the time series.
  • Accuracy: Ensure the quantification of commodity production or use is sufficiently accurate to enable users to make decisions with reasonable assurance as to the integrity of the reported information.

Information is considered relevant if it contains the detail that users, both internal and external to the company, need for their decision-making. When considering what to disclose, please identify and report information that is likely to be of use and benefit to the audience requesting it (in this case the investment community).

Working definitions

  • Deforestation vs sustainably harvested: Please note that for timber-based commodities deforestation by its most rudimentary definition, i.e. the process of cutting down trees, is part of the production process. In these instances, management processes may be articulated in terms of ‘sustainable’ rather than ‘deforestation-free’ harvesting.
  • Direct operations: your organization’s operations include anything your company does itself for the purpose of producing goods and services and maintaining the functionality of the business. This covers any internal supply chains between your organization’s business units. For example, a business unit within your company that supplies components to another business unit within your company would be considered part of your organization’s own operations.
  • Forest*: tree-covered land - spanning more than 0.5 hectares with trees higher than 5 meters and a canopy cover of more than 10% - that is not predominantly under agricultural or urban land use (Source: FAO Forest Resources Assessment, Working Paper 180, 2015).
  • Forests-related issues: for the purposes of the forests questionnaire, this refers to deforestation and forest degradation as well as clearance and destruction of other natural vegetation.
  • Natural habitat (or ecosystem): areas composed of viable assemblages of plant and/or animal species of largely native origin, and/or where human activity has not essentially modified an area’s primary ecological functions and species composition (Source: International Finance Corporation – IFC, Performance Standard 6). This includes all types of natural habitats, e.g. natural forests, savannahs, natural scrublands, peatlands, wetlands, and natural grasslands.
  • Supply chain: your organization's supply chain is comprised of all external inputs to your operations, including materials, components, consumable inputs, and services. The scope of your supply chain may extend to multiple levels of supply, e.g. component suppliers and the suppliers of raw materials used to produce those components.
  • Sustainable procurement is the broader process concerned with the logistics of acquiring materials. According to the Sustainable Procurement Task Force (SPTF) it “is a process whereby organizations meet their needs for goods, services, works and utilities in a way that achieves value for money on a whole life basis in terms of generating benefits not only to the organization, but also to society and the economy, whilst minimizing damage to the environment”.(Source: Department for Environment, Food and Rural Affairs, 2006).
  • Sustainable production refers to a “productive, competitive and efficient way to produce agricultural products, while at the same time protecting and improving the natural environment and social/economic conditions of local communities”.(Source: The Consumer Goods Forum, 2017). Sustainable materials are defined as materials that are independently certified or otherwise verified as sustainable, such as those that have third-party certification from a credible scheme.
  • Sustainably sourced: Sustainable development, according to the Brundtland Commission of the United Nations, “is development that meets the needs of the present without compromising the ability of future generations to meet their own needs." (Source: United Nations General Assembly, 1987). In this context, sustainable sourcing can be understood as sourcing of materials that takes into account social and environmental responsibility to minimize resource depletion and thus ensures the ability to continue sourcing them in future (Source: The Consumer Goods Forum, 2017).
  • Value chain: the entire sequence of activities or partners that provide value to or receive value from an organization’s products and services, either within, upstream or downstream of direct operations.

*CDP recognizes that a definition of a ‘Forest’ is still under debate. For the purpose of this request, please use the definition given in this document.

Sector introduction: Paper & forestry (Forests)

This sector is part of CDP’s agricultural cluster. For climate change, this cluster includes agricultural commodities (AC), food, beverage, & tobacco (FBT) and paper & forestry (PF) sectors.

Activities in the PF sector include the production and/or sourcing of timber and timber-based products. Note that non-timber forest products (NTFPs e.g., rubber, nuts, seeds, etc.) are excluded, as the production and/or sourcing of these products are generally done at a smaller scale and consumed in local markets. Organizations that produce/source NTFPs are included in our AC sector.

Risks associated with the PF sector extend across the whole value chain and arise from:

  • unsustainable forest management activities, such as illegal logging, burning or other practices that may cause deforestation/forest degradation
  • the sourcing of timber-based products for the manufacture of wooden goods, paper, and packaging
  • the use of wood as biofuel for facility energy use
  • the downstream and upstream transportation and distribution
  • the waste management from plantation/machinery residues

The general forests questionnaire has been developed to address specific issues related to the production and sourcing of forest risk commodities, and thus, it entirely focuses on the agricultural and forestry impacts on forests. Therefore, the general forests questionnaire is suitable to capture data from those organizations in the AC and FBT sectors. With regard to the PF sector, CDP has tailored the general questionnaire to address or emphasize various sector-specific issues, including the following:

  • Commitment criteria which are mostly relevant to sustainable forestry practices
  • A data point to capture progress on projects that seek to achieve habitat restoration and/or habitat protection

5. New Directions

There have been two recent developments in ecology which are of general philosophical interest moreover, they help mitigate the problems of complexity and uniqueness noted in Section 1. Both developments were made possible by the astronomical increase in the speed and ease of computation since the early 1980s.

5.1 Individual-Based Models

In the type of population ecology that was discussed earlier (in Section 2), populations were characterized by their Etat variables, parameters such as size or density describing the population as a whole and&mdashwith two exceptions&mdashignoring individual differences. The exceptions are age and stage the age or stage structure of populations (the fraction of individuals in each age or developmental stage class) is sometimes incorporated in the traditional models of population ecology. Since about 1980, that situation began to change when the so-called &ldquoindividual-based models&rdquo (IBMs), which incorporate individual differences, began to be explored systematically. [87] IBMs represent a population as a collection of individuals with variable properties such as size, growth-rate, biomass, and so on. The interactions between individuals are incorporated into the model. Since, because of their sheer complexity, such models are typically impossible to study analytically, they are studied by simulation on a computer. The wealth of detail that can be incorporated into IBMs allows specific predictions to be made. Part of the attraction of IBMs has been their relatively greater predictive success compared to other types of ecological models. [88]

IBMs are particularly useful because they can also be spatially explicit (see Section 5.2), that is, they can incorporate locational relationships between the individuals being modeled. These models have even been used to assess change on a global scale. For instance, forest models (which are among the most successful IBMs) have been used to assess the result of climate change on the atmosphere because of a potential breakdown of the presumed balance between production and decomposition of carbon-containing compounds. Such an extrapolation of scale relies on sampling each of the terrestrial lifezones and constructing some IBMs for all of them, and subsequently integrating the results. [89] The future will show how reliable this strategy is. IBMs have also recently begun to be used for population viability analysis, tracking the trajectory of each individual during its lifetime. [90] This use is likely to grow. In both the situations discussed here, the main problem with the use of IBMs is the immense quantity of reliable data that they require.

Within the context of population ecology, since the behavior of the entire population is putatively being explained on the basis of the properties of the individuals within them, using IBMs is, philosophically, a reductionist strategy called &ldquomethodological individualism.&rdquo [91] Here, &ldquoreductionism&rdquo means that models of large systems should try to explain their behavior entirely in terms of the properties of their parts (nowhere referring to intrinsically &ldquosystemic&rdquo [92] properties). More specifically, such a reductionism amounts to the assumption that properties and interactions of individuals alone suffice to explain all behavior at the level of populations (and higher units): there is no need to refer to higher level or systemic properties which cannot be defined in terms of individual properties (for instance, the density of a population). Moreover, since interactions between individuals of different species can also be incorporated into these models, community-level properties can also potentially be explained by IBMs. For instance, the structure of food webs can potentially be explained by IBMs that take into account habitat size and resources. [93] Thus, even community structure is potentially reducible to individual interactions. In this sense, community ecology, like population ecology, is also being reduced to IBMs. [94] In this way, IBMs are unifying at least these two subfields within ecology. Demarcation ambiguity is not a problem for IBMs rather, it is a virtue. It remains surprising how little philosophical attention IBMs have so far received. If they succeed, they will help end the long and, at least arguably, sterile tradition of anti-reductionism (or holism) in ecology.

Nevertheless, an important limitation of IBMs should not go unnoticed: models of this type&mdashthat is, all models that have to be analyzed by computer simulation&mdashhave the shortcoming that they often fail to provide theoretical insight in the sense of identifying the critical heuristics or principles that are responsible for a type of behavior. Are the dynamical rules responsible for some behavior? Or the structural constraints, such as the initial conditions? Or the precise parameter values? To answer such questions&mdashwhich is at least part of what theoretical understanding consists of&mdashminimally requires the simulation of a large class of related models, often hard to achieve in practice. It remains the case that these questions can often easily be answered using traditional mathematical models: an ounce of algebra may well be worth a ton of computer simulation. Thus any defense of reductionism in ecology based on IBMs must be very limited.

5.2 Spatial Ecology and Geographical Information Systems

What has perhaps the greatest potential for altering the shape of ecology is the advent of Geographic Information Systems (GIS) which enables the detailed spatial representation and rapid manipulation of geographical data on computers. GIS came along at a time when ecologists had already begun to explore the role of spatial structure on the dynamics of populations, communities, and ecosystems. Within spatial ecology these were represented as entities having spatial relations with each other, besides the traditional ecological relations defined by their interactions. However, before GIS, tractable models required the idealization of uniform geometries (even in IBMs). The advent of GIS allowed the replacement of this idealization with more veridical spatial relations. Since philosophers of science have so far paid little attention to the history or implications of GIS technology, the discussion here will be somewhat more detailed than the treatment of other aspects of ecology.

GIS originated in sparsely-populated Canada which, until the 1950s, at both the federal and provincial governmental levels, viewed land and other resources as unlimited. The late but inevitable realization that this was not the case led the Canadian federal government to initiate a national inventory of land and other natural resources. The purpose of what was christened as the &ldquoCanadian Geographical Information System&rdquo in 1963-64 was to analyze data collected by the Canada Land Inventory (CLI) to produce statistics that could be used to develop land management plans for effective resource utilization in large areas of rural Canada. [95] The CLI produced seven maps classifying land. [96] Constructing the CGIS meant developing techniques for the rapid handling and analysis of these maps and the data on which they were based. Today's commercial packages GIS parasitize key conceptual and technical innovations of the CGIS. At the technical level, when the CGIS project was initiated, there was no prior experience on how to structure geographical data internally (within the computer) there were no techniques for the overlay of maps or for calculating area. An experimental scanner to scan map data had yet to be built.

Among conceptual innovations, the most important was the distinction between: (a) the data used to draw the polygons forming the boundary of a place (locational information) and (b) the set of features it has, that is, its attributes. Polygons need not have the same size or geometry. When ecological populations and communities are modeled in a GIS framework, explicit asymmetric irregular spatial information can be incorporated without unrealistic simplifying assumptions such as that of representing the spatial structure as a square or some other regular geometric grid. The exploitation of this possibility takes spatially explicit ecological modeling beyond its traditional confines in which the only spatial structures that could be considered are those with regular geometries. Though GIS-based ecological modeling is still in its infancy (and an early example will be discussed in the next paragraph), it is clear that these techniques will allow the construction of spatially-explicit ecological models at a level of detail that was impossible before. Moreover IBMs can now be constructed with such detailed spatial representation. The confluence of IBMs and GIS is arguably the most fecund area of ecological modeling today.

Equally as important as the distinction between polygon and attribute was the decision to &ldquovectorize&rdquo the scanned images. Scanned images gave &ldquoraster&rdquo data, that is, data in the form of regular grid points which either do or do not possess a specific property, for instance, the presence of a given vegetation type. Vectorization is the replacement of these point-based structures by lines that are naturally interpreted (such as boundaries of habitat types). What is critical is that these lines can then be joined to form polygons. Raster data can be obtained from a variety of sources including maps and photographs in the present context what is critical is that raster data can be obtained by remote sensing through satellite imagery from which the distribution of many vegetation and soil types can be inferred. As early as 1989 Running and several collaborators estimated the annual evapotranspiration and net photosynthesis for a 28 ´ 55 sq km region of Montana using a GIS software package. [97] The study region was divided into 1.1 ´ 1.1 sq km cells defined by satellite sensor pixel size. The GIS package was used to integrate topographic, soil, vegetation and climatic data from a variety of sources including the results of remote sensing. Ecological assumptions entered into the models that were then used to predict evapotranspiration and net photosynthesis. The results obtained were in fairly good agreement with field data.

Within ecology the use of GIS-based models is the analog of visual modeling in other sciences. [98] It is no longer controversial that visual representation, at least as a heuristic, offers resources for scientific innovation not offered by purely linear representations (such as linguistic or mathematical representations). GIS-based models constitute two-dimensional visual representations of ecological systems. It is likely that these representations incorporate spatial insights that will result in new and fecund directions for ecological modeling to take.

Nevertheless, what is somewhat philosophically troubling about the use of GIS in ecology is the conceptualization and representation of geographical information as: (a) a linked set of places, linked in the sense that the places must maintain fully precise adjacency relations but (b) an unlinked set of attributes (for instance, the presence or absence of species or other biological features). There is something disarmingly natural about this: it certainly seems to capture the geographical rootedness in place that lies at the basis of planning for biodiversity conservation. But this choice of representation has its costs: the mode of representation which is at the core of GIS makes it &ldquonatural&rdquo to represent systems in such a way that certain types of relationships tend to get lost, or at least relegated to the background, while others receive emphasis. Considérez l'exemple suivant. Carnivores cannot be present at any place unless prey species also exist. This trivial and obvious ecological fact cannot be explicitly represented using the standard resources of any GIS package (that is, it cannot be represented without writing special programs). Attributes are represented without relations between them. This encourages, though does not require, analyses that do not use relations between attributes. (Obviously, one can start with a GIS-based representation and add other relations as part of the superstructure of the model.) Philosophers of science have long known that modes of representation influence the introduction and development of conceptual systems based on them. GIS may have such an influence through representational choices that guides ecology down a path where relations between attributes receive less emphasis than they would in traditional ecological models.


Introduction

The ongoing sixth mass extinction crisis, under ever increasing human pressures, urgently calls for a better understanding of the main processes shaping the distribution of biological diversity on Earth. However, most global studies are investigating biodiversity at the species level 1,2,3,4 , while a few studies examine the diversity of genes within organisms, i.e. genetic diversity 5 . Indeed, the cost of sampling and genotyping a sufficient number of individuals within species has limited our understanding of the determinants of intraspecific genetic diversity, particularly at large scale. Spatial patterns of genetic diversity are mainly documented locally or regionally, mostly for a single species or a few species in phylogeographic 6 or landscape genetics studies 7,8 .

Yet, determining the global distribution of intraspecific genetic variation and its main drivers is urgent, given that genetic diversity might be undergoing silent and poorly documented erosion under global changes 9 . Genetically distinct local populations may go extinct before the whole species does 10,11,12 , resulting in the erosion of genetic diversity and adaptive potential for many species 13 . In this context, investigating the key determinants of genetic diversity patterns and their underlying biological processes would help to design comprehensive conservation schemes, i.e. protected areas, for this neglected component of biodiversity 14,15,16 . Surprisingly, there is currently only a limited description and comprehension of the large-scale organisation of genetic diversity 17,18 .

Intraspecific genetic diversity might show biogeographic patterns congruent with those of species diversity as a result of processes acting along a micro- to macroevolution continuum 19,20,21,22 . Among the hypotheses explaining spatial congruence between intra- and inter-specific levels of diversity, the evolutionary speed hypothesis posits that higher temperatures foster higher metabolic and mutation rates, as well as faster generation times, which should in turn increase genetic divergence, speciation rate and, ultimately, species diversity 23 . Under this hypothesis, species and genetic diversity are both expected to be higher in warmer regions. A positive association between species, genetic diversity, and temperature is also expected under the “colonisation hypothesis” (or “stability hypothesis”) where demographic fluctuations are associated with environmental instability which in turn limits diversity. These events are generally followed by stochastic recolonisation generating bottlenecks, which may lower both species and genetic local diversity 24 . Typically, warmer areas in the tropics have experienced less historical variability, whereas cold areas were highly unstable, generating species diversity clines along temperature gradients 4 . The energy hypothesis assumes that more productive areas sustain larger population sizes, which should favour higher genetic diversity and allow the persistence of more species along with, eventually, a higher speciation rate 25,26 . Finally, the physical complexity hypothesis states that areas with higher habitat complexity should provide more ecological niches and hence support higher species diversity 27,28 , but also more spatially structured populations in a given area so a higher genetic diversity 29 . This physical complexity hypothesis strongly depends upon the spatial grain and extent of the study area. For instance, at a large scale, a complex network of watercourses, typically characterising freshwater habitats, should promote higher genetic (and species) diversity than more homogenous and continuous marine waters.

Miraldo et al. 18 were the first to take advantage of the vast and ongoing accumulation of georeferenced genetic information on DNA sequences. From a compilation of thousands of short genetic sequences for terrestrial vertebrates (<600 bp), they revealed higher genetic diversity in tropical than in temperate regions. Although this finding seems coherent with known patterns of species diversity in vertebrates 30 , the extent to which intraspecific genetic and species diversity show similar distributions across regions or ecosystems remains to be explored 31 .

Ray-finned fishes (Actinopteyigii) are an old clade of vertebrates that radiated into diverse habitats including marine and freshwater environments, from the tropics to the poles 32,33 . They represent a fascinating case study to investigate the association between genetic diversity, species diversity and the environment in different regions and ecosystems. Freshwater fish diversity (total number of species) is higher than marine fish diversity (

14,800 species, respectively) while marine environments cover

70% of Earth and 97% of all waters 34,35 . In marine ecosystems, fish species diversity is concentrated in coastal waters (depths of <200 m) that represent <1% of the world’s sea surface 36 . Marine and freshwater fish diversity also declines with decreasing temperature at large spatial scale 3,37 . These global patterns suggest that differences in ecosystem productivity, environmental conditions and habitat connectivity or complexity likely shape fish species diversity 27 . Whether these patterns hold at the intraspecific level, i.e. genetic diversity, has not yet been investigated.

Here, from a macro-genetic perspective, we study the global distribution of genetic diversity in ray-finned fishes using data for 1611 freshwater and 3815 marine species. Genetic diversity patterns are produced by assembling 50,588 georeferenced mitochondrial sequences in the Barcode of Life Database (BOLD). We then estimate nucleotide diversity for each species in each grid cell at a spatial resolution of 200 km. This nucleotide diversity is averaged across the species in each cell. We first investigate the correlation between genetic and species diversity separately for marine and freshwater fishes. Next, we explore the global environmental and geographic determinants of the mean nucleotide diversity across species per cell, hereafter called genetic diversity. We interpret our results according to the micro-macro continuum concept and in the light of the evolutionary speed, colonisation, energy and habitat complexity hypotheses.


Affiliations

Department of Geodesy and Geomatics Engineering, University of New Brunswick, Canada

Sheng Gao, Darka Mioc & David J Coleman

Department of Informatics and Mathematical Modelling, Technical University of Denmark, Denmark

New Brunswick Lung Association, Canada

You can also search for this author in PubMed Google Scholar

You can also search for this author in PubMed Google Scholar

You can also search for this author in PubMed Google Scholar

You can also search for this author in PubMed Google Scholar

You can also search for this author in PubMed Google Scholar

Corresponding author


Characterizing three dimensional (3-D) morphology of residential buildings by landscape metrics

The key attributes of landscape pattern include composition and configuration, which can be depicted by landscape/spatial metrics. An emerging pathway is leveraging vertical data to advance three-dimensional (3-D) spatial metrics to interpret landscape attributes and quantify 3-D patterns.

Objectifs

We introduced a suite of spatial metrics to recognize 3-D morphological characteristics of residential communities and examine their temporal changes.

Méthodes

Seventeen 3-D spatial metrics were designed and computed at patch-, class-, and landscape-levels based on building footprints and height information in geographic information system (GIS). These metrics characterized 3-D forms of residential communities, including number, area, height, shape, and diversity. These 3-D features were further used to recognize five typical built types based on the scheme of local climate zone (LCZ) and quantify their 3-D morphological changes with rapid urbanization.

Résultats

The 3-D spatial metrics performed well in describing vertical and volumetric characteristics of residential communities and distinguishing five typical built types in Xiamen, China. Our results indicated that architectural styles of residential communities changed from homo- to mixed-rise buildings and from compact to open arrangement with rapid urbanization.

Conclusions

Both 2-D and 3-D features are key attributes of the landscape. Our results showed that 3-D spatial metrics were not only useful tools for quantifying surface patterns but also key complements to vertical feature characterization, offering advantages in representing urbanization over the existing indexes. Growing 3-D datasets have great potential to develop more valuable metrics for characterizing spatial features, capturing ecological processes, and understanding drivers in various landscape contexts.


Voir la vidéo: Uomocentrica e responsabilità - FR (Octobre 2021).