Suite

PointStacker - Emplacements aléatoires à différents niveaux de zoom


J'applique la transformation PointStacker sur l'une de mes couches à l'aide de Geoserver 2.5.2 et OpenLayers 2.

Je sais que j'ai 7 points de données situés exactement au même endroit. Cependant, lorsque je modifie le niveau de zoom, le point empilé se déplace de manière aléatoire. J'aurais pensé que l'emplacement du point empilé est calculé par la moyenne des points vectoriels empilés. En d'autres termes, s'ils sont situés au même endroit, il ne devrait pas se déplacer en changeant les niveaux de zoom.

Qu'est-ce que je fais mal?

niveau de zoom 7 :

niveau de zoom 8 :

niveau de zoom 9 :

niveau de zoom 10 :

niveau de zoom 11 :


Votre hypothèse sur la façon dont PointStacker calcule l'emplacement du point de cluster est incorrecte. Il n'utilise pas le centre de masse de la manière à laquelle vous vous attendriez.

Les limites de la demande d'images sont divisées en une grille et des clusters sont créés pour chaque cellule de cette grille. Donc, si vous avez ce qui vous semble être un cluster naturel, par ex. 3 points proches les uns des autres, ils ne seront regroupés que si tous les 3 sont dans la même cellule de la grille. S'ils tombent dans 3 cellules de la grille, ils seront affectés à 3 groupes distincts.

Lorsque vous effectuez un zoom avant, les points n'atterrissent pas dans la même cellule de grille que dans l'image précédente et, par conséquent, le cluster reçoit un nouvel emplacement par rapport à la largeur et à la hauteur de l'image.

Ce n'est pas le comportement le plus intuitif, mais il rend un algorithme de clustering beaucoup plus simple. Vous pouvez voir le code ici : https://github.com/geotools/geotools/blob/master/modules/unsupported/process-feature/src/main/java/org/geotools/process/vector/PointStackerProcess.java


Je pense que cela est dû au paramètre cellSize.

Si vous définissez ce paramètre sur 1 (les emplacements que vous souhaitez agréger sont exactement les mêmes, le marqueur doit être affiché à cet emplacement.

Si vous augmentez cellSize, le marqueur sera placé de manière quelque peu aléatoire dans un tampon défini par cellSize en pixel.

 taillecellule 1

Une méthode de régionalisation axée sur le lieu et à niveaux mixtes pour la construction de zones géographiques dans la diffusion et l'analyse des données sur la santé

Des zones géographiques similaires ont souvent de grandes variations dans la taille de la population. Dans la gestion et l'analyse des données de santé, il est souhaitable d'obtenir des régions de population comparable en décomposant des zones de grande population (pour gagner plus de variabilité spatiale) et en fusionnant des zones de petite population (pour masquer la confidentialité des données). Basée sur l'algorithme de la courbe de Peano et le clustering espace-échelle modifié, cette recherche propose une méthode de régionalisation à niveaux mixtes (MLR) pour construire des zones géographiques avec une population comparable. La méthode tient compte de la connectivité spatiale et de la compacité, de l'homogénéité attributive et des critères exogènes tels que le nombre minimum (et approximativement égal) de population ou de maladie. Une étude de cas utilisant des données sur le cancer de la Louisiane illustre la méthode MLR, ses forces et ses limites. Un avantage majeur de la méthode est que la plupart des limites géographiques de niveau supérieur peuvent être préservées pour accroître la familiarité des zones construites. Par conséquent, la méthode MLR est plus axée sur l'humain et basée sur le lieu que sur l'ordinateur et basée sur l'espace.

Les méthodes de regroupement spatial ou de régionalisation sont couramment utilisées dans les systèmes d'information géographique (SIG) et la santé publique à des fins de confirmation ou d'exploration (Cromley et McLafferty 2012b). Le clustering a deux définitions différentes et les deux sont bien acceptées : le partitionnement, qui attribue une appartenance à un cluster unique à n'importe quel endroit de la zone d'étude, et le non-partitionnement (c'est-à-dire l'identification des centres de cluster), qui n'a pas d'exigence inclusive pour Lynch 1982 Hanson et Wieczorek 2002 Szwarcwald, Andrade et Bastos 2002 Oliver et al. 2006 Schootman et al. 2007 Shishehbor et al. 2008 Moore et al. 2009 Nelson et al. 2009). Cet article se concentre sur la régionalisation, mais certaines discussions utilisent également le terme regroupement comme convention dans la littérature. Un défi pour bon nombre de ces méthodes n'est pas le développement d'algorithmes, de calculs ou de mise en œuvre technique, mais plutôt de donner un sens ou d'interpréter les résultats. Les résultats significatifs ne concernent pas seulement la taille et la forme des grappes, mais l'alignement des grappes avec les zonages existants, en particulier les limites des principales unités géographiques. Un objectif fondamental de la régionalisation est de regrouper et de simplifier les données, de ne pas introduire davantage de complexité en ajoutant plus de limites qui ne sont pas reconnaissables par les administrateurs, les praticiens publics ou le grand public.

“Le lieu est la sécurité, l'espace est la liberté” (Tuan 1977, 3). L'approche de la géographie humaniste de Tuan (1974, 1977, 2012) a influencé des générations de géographes en clarifiant la relation entre lieu et espace. Tuan a illustré les fonctions de la frontière en tant que lieu délimitant l'espace, comme le sens (ou l'attachement) d'un Esquimau aux lieux de commerce et à l'espace de chasse (Carpenter, Varley et Flaherty 1959), et a identifié l'espace comme un lieu avec des repères et des chemins familiers qui sont souvent vus. comme frontières. Notre méthode de régionalisation s'inspire de cette conceptualisation de “lieu + espace + identité + attachement” par les géographes (Tuan 1974, 1977 Sack 1980, 2003 Adams, Hoelscher et Till 2001). Yiannakoulias (2011) a préconisé une approche « centrée sur le lieu » ou « informée sur le lieu » pour intégrer des facteurs localement pertinents dans tous les aspects des activités humaines dans la formation de lieux ou de régions pour une surveillance de santé publique significative des aberrations spatiales. L'espace est plus général et abstrait, et le lieu est plus attaché aux personnes et à l'environnement. Bien que de nombreuses méthodes de régionalisation soient orientées vers l'espace, cette recherche est conçue pour développer une méthode de régionalisation ou de regroupement axée sur le lieu qui préserve les principales frontières géopolitiques en tant qu'élément clé de l'identité et de l'attachement.

Les limites sont importantes pour maintenir la familiarité et la hiérarchie dans une carte (Lloyd et Steinke 1986). Des recherches géographiques, cartographiques et psychologiques ont montré que les lecteurs de cartes organisent et traitent leur mémoire spatiale de manière hiérarchique en groupes, et s'appuient sur des caractéristiques familières pour interpréter et comprendre le contenu de la carte (McNamara, Hardy et Hirtle 1989 Rittschof et al. 1996 Fotheringham et Curtis 1999 Jones et al. 2004) et les caractéristiques spatiales de l'environnement (Hirtle et Jonides 1985). La frontière joue un rôle interdépendant dans la compartimentation psychologique et géographique (Sack 2003). Les limites et les bordures sont également abordées dans le contexte de l'espace, du lieu, de la sécurité et du territoire calculables (Rose-Redwood 2012). Les données géographiques sont fournies de manière hiérarchique à l'aide d'unités d'État, de comté, de secteur de recensement et autres, et les limites de ces unités servent de référence essentielle à la familiarité. En plus des unités géopolitiques, il est également important de conserver d'autres frontières géographiques, à l'intérieur desquelles les forces sous-jacentes et les processus à l'étude diffèrent. Par exemple, dans F. Wang, Guo et McLafferty (2012), une méthode de régionalisation est appliquée séparément aux zones de catégories d'urbanité distinctes pour préserver leurs limites.

La taille de la population varie généralement considérablement d'une zone à l'autre au même niveau. Dans l'analyse et la diffusion des données de santé publique, il est souvent souhaitable d'obtenir des régions de population comparable (F. Wang, Guo et McLafferty 2012). Les zones de grande population doivent être décomposées pour obtenir une plus grande variabilité spatiale, et les zones de petite population doivent être fusionnées pour protéger la géoprivacy. Le maintien de limites géographiques de niveau supérieur rendrait-il une méthode de régionalisation plus axée sur le lieu ? Par exemple, si les données sont disponibles au niveau du secteur de recensement, les limites des comtés devraient-elles être préservées autant que possible dans la régionalisation ? Cette recherche propose une méthode de régionalisation à niveaux mixtes (MLR) ou de clustering spatial axée sur le lieu. Plus précisément, la conceptualisation de “place = espace + identité + attachement” est abordée en deux temps. Comme la limite sert d'identifiant important pour les lieux, notre méthode vise à préserver les limites des unités géographiques de niveau supérieur et à minimiser les opérations au niveau inférieur. Attachement est pris en compte en imposant une contrainte de similarité attributive à la méthode de régionalisation. Ce faisant, les régions résultantes semblent toujours familières ou reconnaissables.

Lorsque l'on travaille avec des données de santé, la géoconfidentialité est une préoccupation commune qui conduit à agréger des données individuelles en unités de zone. L'objectif global de cette recherche est de développer une méthode de régionalisation pour la diffusion et l'analyse des données de santé tenant compte non seulement de la compacité spatiale et de l'homogénéité attributive communément considérées, mais aussi de la familiarité et de la géo-intimité. Cette description sert d'énoncé général du problème, et les paramètres détaillés sont illustrés par une étude de cas de données sur la santé (en particulier le cancer). Cela peut certainement profiter à toutes les études portant sur le problème de la petite population, y compris l'analyse de la criminalité (F. Wang et O𠆛rien 2005).


1. Introduction

Ceci est un guide pratique pour le géoréférencement. Il décrit les protocoles pour déterminer les formes des entités et comment les utiliser comme base pour le géoréférencement avec la méthode de géoréférencement point-rayon (Wieczorek 2001, Wieczorek et al. 2004, Chapman & Wieczorek 2020) en utilisant le calculateur de géoréférencement (Wieczorek & Wieczorek 2020) et son manuel de calcul de géoréférencement associé (Bloom et al. 2020), des cartes, des index géographiques et d'autres ressources à partir desquelles les coordonnées et les limites spatiales des lieux peuvent être trouvées. Ce document est un protocole de géoréférencement citable. Si un protocole dérivé est utilisé, un nouveau document avec attribution à ce guide doit être rendu public et cité.

Ce Guide est basé sur une première version du Guide (Wieczorek et al. 2012)), qui était à son tour une adaptation du Géoréférencement pour les Nuls (Spencer et al. 2008). Il explique les procédures de géoréférencement recommandées pour les types de localités les plus couramment rencontrés. Ce guide doit être utilisé en parallèle avec les bonnes pratiques de géoréférencement (Chapman & Wieczorek 2020), qui contiennent le contexte théorique et des informations plus détaillées sur les concepts utilisés ici.

Les termes soulignés tout au long de ce document (par exemple, l'exactitude) renvoient aux définitions du glossaire. Les termes en italique (par exemple, Latitude d'entrée ) font référence aux champs et/ou aux étiquettes de la calculatrice de géoréférencement (Wieczorek & Wieczorek 2020) (ci-après dénommée « la calculatrice »). Les termes Darwin Core sont affichés dans un espacement fixe (par exemple, dwc:georeferenceRemarks) dans toute la documentation numérique du GBIF.

À la fin de ce document se trouve un Guide de référence rapide de géoréférencement Clé des types de localités, qui contient un résumé rapide des protocoles pour les types de localités les plus courants, décrits en détail dans les sections de ce guide.

1.1. Objectifs

Ce document fournit des conseils sur la façon de géoréférencer à l'aide de la méthode point-rayon. Ce guide fournit également les méthodes pour déterminer les limites des entités, qui constituent la base de la méthode de géoréférencement des formes.

1.2. Public cible

Ce document est un guide pratique pour quiconque a besoin de géoréférencer des descriptions textuelles de localités afin qu'elles puissent être utilisées dans le filtrage spatial ou l'analyse dans la recherche, l'éducation ou la maintenance des données des collections biologiques.

1.3. Portée

Ce document est l'un des trois qui couvrent les exigences et les méthodes recommandées pour géoréférencer les emplacements. Il fournit un guide pratique pour mettre en pratique la théorie de la méthode de géoréférencement point-rayon.

Le guide s'appuie sur les meilleures pratiques de géoréférencement (Chapman & Wieczorek 2020) pour le contexte, les définitions et des explications plus détaillées de la théorie derrière les méthodes et les calculs trouvés ici et dans la calculatrice.

Le troisième document est le manuel du calculateur de géoréférencement (Bloom et al. 2020), qui décrit comment utiliser le calculateur de géoréférencement. La calculatrice est une application JavaScript basée sur un navigateur qui aide à géoréférencer des localités descriptives et à effectuer les calculs nécessaires pour obtenir les coordonnées géographiques et les incertitudes des emplacements à l'aide de la méthode point-rayon.

Ces documents NE fournissent PAS de conseils sur la géorectification des images ou le géocodage des adresses postales – opérations distinctes parfois appelées « géoréférencement ».

1.4. Modifications par rapport à la version précédente

Cette version du Guide est un remake complet de son édition précédente, réorganisée et augmentée pour inclure des exemples graphiques de chaque type d'emplacement et des étapes détaillées pour savoir comment les géoréférencer. Il y a eu quelques changements dans la terminologie depuis l'édition précédente, qui incluent :

L'étendue dans la version précédente a été changée en radiale. L'étendue, lorsqu'elle est conservée, est utilisée de manière plus traditionnelle pour désigner l'ensemble de l'espace dans un emplacement.

"Lieu nommé" a été remplacé par fonctionnalité.

Là où le centre géographique était recommandé dans le passé, le centre corrigé basé sur la radiale géographique est maintenant utilisé. Il s'agit d'un changement important car le centre géographique n'a pas nécessairement donné la plus petite incertitude en raison de l'étendue d'une caractéristique que le centre et la radiale géographique corrigés font.

1.5. Utilisation de Darwin Core

Les géoréférences utilisant les méthodes de ce guide seront de la plus grande valeur si autant d'informations que possible sont capturées sur et pendant le processus de géoréférencement. La norme Darwin Core (Darwin Core Maintenance Group 2020) définit l'ensemble des champs recommandés pour la capture de géoréférences reproductibles, comme suit :

la combinaison de ces champs fournit la référence pour le centre de la représentation point-rayon du géoréférencement.

La distance horizontale en mètres à partir de la décimaleLatitude et de la décimaleLongitude qui décrivent le plus petit cercle englobant qui contient l'ensemble de l'emplacement. Laissez la valeur vide si l'incertitude est inconnue, ne peut pas être estimée ou n'est pas applicable (parce qu'il n'y a pas de coordonnées). Zéro n'est pas une valeur valide pour ce terme. Ce terme correspond à la radiale géographique du géoréférencement final.

la ou les personnes qui ont modifié le géoréférencement pour la dernière fois et à quel moment cela s'est produit. Ceux-ci correspondent à l'autorité finale sur la géoréférence dans son état actuel, indépendamment de qui aurait pu travailler sur les versions précédentes de la géoréférence.

Une description ou une référence aux méthodes utilisées pour déterminer la forme à l'aide de la méthode de géoréférencement de la forme, ou les coordonnées et l'incertitude à l'aide de la méthode point-rayon. Si le protocole de ce Guide est utilisé tel quel, alors le GeoreferenceProtocol doit être la référence pour ce document.

Une liste (concaténée et séparée) de cartes, de répertoires géographiques ou d'autres ressources utilisées pour géoréférencer l'emplacement, décrites de manière suffisamment précise pour permettre à quiconque à l'avenir d'utiliser les mêmes ressources.

USGS 1:24000 Florence Montana Quad 1967
Terramétrie 2008 Google Earth
Wieczorek C & J Wieczorek (2020) Calculateur de géoréférencement, version aaaammjj. Disponible : http://georeferencing.org/georefcalculator/gc.html.

Une description catégorique de la mesure dans laquelle la géoréférencement a été vérifiée pour représenter la meilleure description spatiale possible. La meilleure pratique recommandée est d'utiliser un vocabulaire contrôlé. Notez que cette vérification ne peut être effectuée que par rapport à l'événement ou à l'événement enregistré.

nécessite une vérification
vérifié par le collecteur
vérifié par le conservateur

Notes ou commentaires insolites sur le géoréférencement, expliquant des hypothèses faites en complément ou en opposition à celles formalisées dans la méthode visée dans le protocole de géoréférencement.

distance supposée par la route (autoroute 101)

Notes ou commentaires d'intérêt sur l'emplacement (pas la géoréférence de l'emplacement, qui vont dans georeferenceRemarks).

La Villa Epecuen a été inondée en novembre 1985 et a cessé d'être habitée jusqu'en 2009

1.6. Concepts de géoréférencement

L'un des objectifs du géoréférencement suivant les meilleures pratiques est de s'assurer que suffisamment d'informations sont fournies dans la sortie pour que le géoréférencement soit reproductible (voir Principes des meilleures pratiques dans les meilleures pratiques de géoréférencement (Chapman & Wieczorek 2020)). À cette fin, ce document fournit un ensemble de recettes pour le géoréférencement de divers types de localités à l'aide du calculateur de géoréférencement. La calculatrice vous permet d'effectuer différents types de calculs en fonction du type de localité (§1.6.1). Lorsque le type de localité est choisi dans la liste prédéfinie, la calculatrice présente des zones de saisie pour tous les paramètres nécessaires à ce type de calcul. Notez que le type de localité est pour la clause la plus spécifique dans la description de la localité (voir Analyser la description de la localité dans les meilleures pratiques de géoréférencement (Chapman & amp Wieczorek 2020)). Cependant, il peut y avoir des informations pour d'autres clauses ou d'autres parties de l'enregistrement d'emplacement qui aident à contraindre l'emplacement et entrent en jeu lorsqu'une limite d'entité est déterminée. De nombreux paramètres de la calculatrice sont utilisés pour plusieurs types de localités. Plutôt que de répéter l'explication pour chaque type de localité, elles sont rassemblées ici pour référence commune. Certains types de localités nécessitent des paramètres spécifiques, pour lesquels les explications correspondantes sont incluses dans chaque sous-section du §2. Reportez-vous au Manuel de la calculatrice de géoréférencement (Bloom et al. 2020) pour plus de détails sur la calculatrice sans réponse dans ce document.

1.6.1. Type de localité

Le type de localité fait référence au modèle de la partie la plus spécifique d'une description de localité à géoréférencée – celle qui détermine la méthode de calcul à utiliser. Le calculateur propose des options pour calculer les géoréférences pour six types de localités de base :

Distance le long des directions orthogonales

La sélection d'un type de localité configurera la calculatrice pour afficher tous les paramètres qui doivent être définis pour effectuer le calcul de géoréférencement. Ce guide donne des instructions spécifiques sur la façon de définir les paramètres pour de nombreux exemples différents de chacun des types de localité.

1.6.2. Centre corrigé

Le centre corrigé est le point à l'intérieur d'un emplacement, ou sur sa limite, qui minimise la radiale géographique (voir §1.6.3). Ce point est obtenu en trouvant le plus petit cercle englobant qui contient l'intégralité de l'entité, puis en prenant le centre de ce cercle (figure 1A). Si ce centre ne tombe pas sur ou à l'intérieur des limites de l'entité, recherchez le plus petit cercle englobant qui contient l'intégralité de l'entité, mais a son centre sur la limite de l'entité (Figure 1B). Notez que dans le cas corrigé, le nouveau cercle, et donc la radiale, sera toujours plus grand que celui non corrigé. Dans la calculatrice, les coordonnées correspondant au centre corrigé sont intitulées Latitude d'entrée et Longitude d'entrée . Voir l'annexe B : Méthodes pour trouver le centre corrigé et le rayon géographique pour les techniques permettant de déterminer le centre corrigé.

1.6.3. Radial de la caractéristique

Une entité est un endroit dans la description de la localité qui a une étendue et peut être délimité par une limite. La radiale géographique de l'entité (indiquée comme radiale de l'entité dans la calculatrice) est la distance entre le centre corrigé de l'entité et le point le plus éloigné de la limite géographique de cette entité (voir Figure 1 et Étendue d'un emplacement dans Bonnes pratiques de géoréférencement (Chapman & Wieczorek 2020)). Notez que la radiale était appelée « étendue » dans les documents et versions antérieurs de la calculatrice. Voir l'annexe B : Méthodes pour trouver le centre corrigé et le rayon géographique pour les techniques permettant de déterminer le rayon géographique.

La géoréférence finale aura une radiale géographique distincte de la radiale géographique de l'une des caractéristiques de la description de la localité (car elle englobera également toutes les sources d'incertitude), et une fois le calcul effectué, cela sera affiché dans la sortie du Calculatrice dans le champ Incertitude.

1.6.4. Latitude

Étiqueté comme Latitude d'entrée dans la calculatrice. Coordonnée géographique au nord ou au sud de l'équateur (où la latitude est 0) qui représente le point de départ d'un calcul de géoréférencement et dépend du type de localité.

Les latitudes en degrés décimaux au nord de l'équateur sont positives par convention, tandis que les latitudes au sud sont négatives. La calculatrice prend en charge trois formats de coordonnées géographiques en degrés pour la latitude et la longitude : degrés décimaux (par exemple -41.0570673), degrés minutes décimales (par exemple 41° 3.424") et degrés minutes et secondes (par exemple 41° 3' 25.44" S).

1.6.5. Longitude

Étiqueté en tant que longitude d'entrée dans la calculatrice. La coordonnée géographique à l'est ou à l'ouest du premier méridien (un arc entre les pôles nord et sud où la longitude est 0) qui représente le point de départ d'un calcul de géoréférencement et dépend du type de localité.

Les longitudes en degrés décimaux à l'est du premier méridien sont positives par convention, tandis que les longitudes à l'ouest sont négatives. La calculatrice prend en charge trois formats de coordonnées géographiques en degrés pour la latitude et la longitude : degrés décimaux (−71,5246934), degrés-minutes décimaux (71° 31,482") et degrés minutes et secondes (71° 31' 28,90" W).

1.6.6. Source de coordonnées

La source de coordonnées est le type de ressource (type de carte, GPS, index géographique, description de la localité) à partir de laquelle la latitude et la longitude d'entrée de départ ont été dérivées.

Le plus souvent, les coordonnées d'origine sont utilisées pour trouver le voisinage général de l'emplacement sur une carte, après quoi le processus de détermination du centre corrigé fournit les nouvelles coordonnées. La source de coordonnées à utiliser dans la calculatrice dans ce cas est la carte à partir de laquelle le centre corrigé a été déterminé, et non la source d'origine utilisée pour déterminer le voisinage général sur la carte. Par exemple, supposons que les coordonnées d'origine proviennent d'un index géographique, mais que la limite et le centre corrigé de l'entité ont été déterminés à partir de Google Maps, la source des coordonnées serait "Google Earth/Maps 2008", et non "index géographique".

Ce terme est lié à, mais NE PAS le même que le terme Darwin Core georeferenceSources, qui nécessite les ressources spécifiques utilisées plutôt que leur type. A noter que les incertitudes des deux sources gazetier et description de la localité ne peuvent pas être anticipés universellement, et ne contribuent donc pas à l'incertitude globale dans les calculs. Si les caractéristiques d'erreur de ces sources sont connues, elles peuvent être ajoutées dans le champ Erreur de mesure avant le calcul. Si le GPS source est sélectionné, l'étiquette d'Erreur de mesure deviendra Précision GPS , qui correspond à l'endroit où la précision du GPS (voir Utilisation d'un GPS dans Bonnes pratiques de géoréférencement (Chapman & Wieczorek 2020)) au moment où les coordonnées ont été prises devrait être saisi.

1.6.7. Format des coordonnées

Le format de coordonnées dans la calculatrice définit la représentation des coordonnées géographiques d'origine (degrés décimaux, degrés minutes et secondes (DMS) ou degrés décimaux minutes) de la source de coordonnées.

Lorsque le type de calcul n'est pas « Coordonnées uniquement », les coordonnées d'origine sont souvent utilisées pour trouver le voisinage général de l'emplacement sur une carte, après quoi le processus de détermination du centre corrigé fournit les nouvelles coordonnées. Le format de coordonnées à utiliser dans la calculatrice dans ce cas est le format de coordonnées sur la carte à partir duquel le centre corrigé a été déterminé, et non le format de coordonnées de la source d'origine utilisée pour déterminer le voisinage général sur la carte. Par exemple, supposons que les coordonnées d'origine proviennent d'un répertoire géographique dans DMS, mais que la limite et le centre corrigé de l'entité ont été déterminés à partir de Google Maps, le format des coordonnées serait en degrés décimaux, pas en DMS.

Ce terme n'est équivalent au terme Darwin Core verbatimCoordinateSystem que si aucune conversion n'a dû être effectuée à partir de la source d'origine vers le format utilisé dans le Latitude d'entrée et Longitude d'entrée (par exemple, si les coordonnées d'origine étaient UTM et que vous deviez les convertir en DMS, alors le Format des coordonnées dans la calculatrice sera DMS, mais le verbatimCoordinateSystem sera UTM. La sélection du format de coordonnées d'origine permet de saisir les coordonnées dans leur format natif et force la calculatrice à présenter les options appropriées pour la précision des coordonnées. La modification du format des coordonnées réinitialisera automatiquement la valeur de précision des coordonnées à degré le plus proche. Assurez-vous de corriger cela pour la précision réelle des coordonnées. La calculatrice stocke les coordonnées en degrés décimaux jusqu'à sept décimales. Cela permet de conserver les coordonnées correctes dans tous les formats, quel que soit le nombre de transformations de coordonnées effectuées.

1.6.8. Précision des coordonnées

Étiqueté dans la calculatrice comme Précision dans la première colonne des paramètres d'entrée, cette liste déroulante est remplie avec des niveaux de précision en accord avec le format de coordonnées choisi. Par exemple, avec un format de coordonnées de degrés minutes secondes , une latitude d'entrée de 35° 22' 24" N et une longitude d'entrée de 105° 22' 28" W, la précision des coordonnées serait la seconde la plus proche . Une valeur exacte correspond à tout niveau de précision supérieur à la précision par ailleurs la plus élevée donnée dans la liste. Les sources de précision des coordonnées peuvent inclure des cartes papier ou numériques, des images numériques, des GPS, des répertoires géographiques ou des descriptions de localités.

La précision des coordonnées à utiliser dans la calculatrice est la précision des coordonnées de la source à partir de laquelle le centre corrigé a été déterminé, et non la précision des coordonnées de la source d'origine utilisée pour déterminer le voisinage général sur la carte. Par exemple, supposons que les coordonnées d'origine proviennent d'un index géographique, mais que la limite et le centre corrigé de l'entité ont été déterminés à partir de Google Maps, la précision des coordonnées serait déterminée par le nombre de chiffres de degrés décimaux que vous avez capturés à partir du centre corrigé sur Google Maps , pas la précision des coordonnées des coordonnées de l'entrée du répertoire géographique d'origine. Si vous utilisez tous les chiffres fournis sur Google Maps, la précision des coordonnées serait "exacte".
Ce terme est similaire à, mais NE PAS le même que le terme Darwin Core coordonnéPrécision, qui s'applique aux coordonnées de sortie.

1.6.9. Données

Définit la position de l'origine et l'orientation d'un ellipsoïde sur lequel les coordonnées sont basées pour la latitude et la longitude d'entrée données (voir le système de référence de coordonnées).

le Données à utiliser dans la calculatrice est la référence (ou ellipsoïde) de la source à partir de laquelle le centre corrigé a été déterminé. Par exemple, supposons que les coordonnées d'origine proviennent d'un répertoire géographique avec un datum inconnu, mais que la limite et le centre corrigé de l'entité ont été déterminés à partir de Google Maps, le Données serait "WGS84", et non "donnée non enregistrée".

Le terme Datum dans la calculatrice est équivalent au terme GeodeticDatum de Darwin Core. La calculatrice inclut des ellipsoïdes dans la liste déroulante Datum, car c'est parfois tout ce que la source de coordonnées montre. Le choix de la référence dans la calculatrice a deux effets importants. Le premier est la contribution à l'incertitude si la donnée des coordonnées d'entrée n'est pas connue. Si la référence et l'ellipsoïde ne sont pas connus, la référence non enregistrée doit être sélectionnée. L'incertitude due à une donnée inconnue peut être sévère et varie géographiquement de manière complexe, avec une contribution dans le pire des cas de 5359 m (voir Système de référence de coordonnées dans Bonnes pratiques de géoréférencement (Chapman & Wieczorek 2020)). Le deuxième effet important de la sélection du datum est de fournir les caractéristiques du modèle ellipsoïde de la Terre, dont dépendent les calculs de distance.

1.6.10. Direction

La direction dans le calculateur de géoréférencement est le cap donné dans la description de la localité, soit comme un point de boussole standard (voir Encadrage de la boussole) ou comme un nombre de degrés dans le sens des aiguilles d'une montre à partir du nord. Le nord géographique n'est pas le même que le nord magnétique (voir En-têtes dans les meilleures pratiques de géoréférencement (Chapman & Wieczorek 2020)). Si un cap est connu pour être un cap magnétique, il devra être converti en un cap vrai (voir Calculateur de champ magnétique NOAA) avant de pouvoir être utilisé dans le calculateur. Si degrés à partir de N est sélectionné, une zone de texte apparaîtra à droite de la sélection, dans laquelle l'en-tête de degré doit être entré.

Certaines descriptions de localités marines font référence à une direction (azimut) vers un point de repère plutôt qu'à un cap à partir de l'emplacement actuel (par exemple "327° to Nubble Lighthouse"). Pour faire d'une Distance un calcul de cap pour une telle description de localité, utilisez le point de la boussole à 180 degrés de celui donné dans la description de la localité (147° dans l'exemple ci-dessus) comme Direction.

1.6.11. Distance de décalage

La distance de décalage dans la calculatrice est la distance de surface linéaire à partir d'un point d'origine. Les décalages sont utilisés pour les types de localité Distance à un cap et Distance uniquement . Si la Distance du type de localité le long des directions orthogonales est sélectionnée, il existe deux décalages distincts :

La distance au nord ou au sud (définie avec la zone de sélection à droite de la zone de texte de distance) de la latitude d'entrée .

Distance de décalage est ou ouest

La distance à l'est ou à l'ouest (définie avec la zone de sélection à droite de la zone de texte de distance) de la longitude d'entrée .

1.6.12. Unités de distance

La sélection Unités de distance indique les unités du monde réel utilisées dans la description de la localité. Il est important de sélectionner les unités d'origine comme indiqué dans la description. Ceci est nécessaire pour incorporer correctement l'incertitude de la précision de la distance. Si la description de la localité n'inclut pas d'unités de distance, utilisez les unités de distance de la carte à partir de laquelle les mesures sont dérivées.

sélectionnez mi pour "10 mi E (par avion) ​​Bakersfield"

sélectionnez km pour "3.2 km au SE de Lisbonne"

sélectionnez km pour les mesures dans Google Maps où les unités de distance sont définies sur km.

Toutes les distances utilisées dans un calcul donné doivent utiliser les mêmes unités. Par exemple, si une distance de décalage a été donnée en miles dans la description de la localité, lors de la saisie de la valeur radiale, vous devez le faire en miles.

1.6.13. Précision de la distance

La précision de la distance , étiquetée dans la calculatrice en tant que précision dans la deuxième colonne des paramètres d'entrée, fait référence à la précision avec laquelle une distance a été décrite dans une localité (voir Incertitude liée à la précision de décalage dans les meilleures pratiques de géoréférencement (Chapman & Wieczorek 2020)). Cette liste déroulante est remplie en fonction des unités de distance choisies et contient des puissances de dix et des fractions simples pour indiquer la précision démontrée dans le décalage d'origine textuelle.

sélectionnez 1 mi pour "6 mi NE de Davis"

sélectionnez ¼ km pour "3,75 km à l'ouest de Hamilton"

1.6.14. Erreur de mesure

L'erreur de mesure représente l'erreur associée à la capacité de distinguer un point d'un autre à l'aide de n'importe quel outil de mesure, comme les règles sur les cartes papier ou les outils de mesure sur Google Maps ou Google Earth. Les unités de mesure doivent être les mêmes que celles de la description de la localité saisie dans les Unités de distance (voir §1.6.12). Le convertisseur de distance au bas de la calculatrice est fourni pour aider à changer une mesure en unités de description de localité. Par exemple, une valeur raisonnable d'erreur de mesure sur une carte est de 1 mm, ce qui sur une carte à l'échelle 1:24 000 serait de 24 m.

1.6.15. Précision GPS

When GPS is selected from the Coordinate Source drop-down list, the label for the Measurement Error text box changes to GPS Accuracy . We recommend entering a value that is at least twice the value given by the GPS at the time the coordinates were captured (see Uncertainty due to GPS in Georeferencing Best Practices (Chapman & Wieczorek 2020). If GPS Accuracy is not known, enter 100 m for standard hand-held GPS coordinates taken before 1 May 2000 when Selective Availability was discontinued. After that, use 30 m as a conservative default value.

1.6.16. Uncertainty

The Uncertainty in the Calculator is the calculated result of the combination of all sources of uncertainty (coordinate precision, unknown datum, data source, GPS accuracy, measurement error, feature extent, distance precision and heading precision) expressed as a linear distance – the geographic radial of the georeference and the radius in the point-radius method (Wieczorek et al. 2004). Along with the Output Latitude , Output Longitude , and Datum , the radius defines a circle containing all of the possible places a locality description could mean. In the Calculator the Uncertainty is given in meters.


Geospaital functionality in Atlas: integration of AEGIS #649

Motivation: During the 2018 OHDSI Symposium, Washington DC USA - J Cho, SC You, K Kim, Y Soh, D Kim, RW Park - presented a software demonstration called 'Application for Epidemiological Geographic Information System (AEGIS) - An open
source spatial analysis tool based on CDM'
. See AEGIS under related work.

AEGIS, was built to support 5.x version of the OMOP CDM. This version did not have latitude and longitude in location table. AEGIS developers used observation and fact_relationship table to design AEGIS using CDM 5.x. The OMOP CDM 6+ (released October 2018) has two location tables (location and location_history). The location table has fields for latitude and longitude. These new fields may be used to represent precise location of persons, providers or care_sites.

During the presentation, a decision was made to upgrade AEGIS to support CDM 6.x with new location table, and to evaluate if it was possible to integrate AEGIS like functionality, and the work of the OHDSI GIS workgroup into ATLAS.

Arrière-plan: Spatial epidemiology is the description, analysis or surveillance of a populations health related factors such as medical service, diseases, in relation to other person level or area level factors like demographic, environmental exposure, behavioral determinants, socio-economic indicators, genetic and infectious risk factors. Two types of spatial epidemiology are discussed below.

Descriptive mapping, widely used in spatial epidemiology, is useful for establishing initial hypotheses about the patterns of incidence/prevalence in an area, or the correlation between exposure to specific factors and disease.

Cluster detection is a more advanced statistical method that may reveal geographic clusters, based on patterns and spatial correlation.

Le texte a été mis à jour avec succès, mais ces erreurs se sont produites :

Nous ne sommes pas en mesure de convertir la tâche en problème pour le moment. Veuillez réessayer.

Le problème a été créé avec succès, mais nous ne sommes pas en mesure de mettre à jour le commentaire pour le moment.


Lidar Base Specification v. 2.1: Glossary

(h) is equal to the ellipsoid height and
(N) is equal to the geoid height.

(n) is the rank of the observation that contains the Pth percentile,
(P) is the proportion (of 100) at which the percentile is desired (for example, 95 for 95th percentile), and
(N) is the number of observations in the sample dataset.

Once the rank of the observation is determined, the percentile (Qp) can then be interpolated from the upper and lower observations using the following equation:

Qp est le Pth percentile the value at ran m
UNE is the array of the absolute values of the samples, indexed in ascending order from 1 to N
UNE[je] is the sample value of array UNE at index je (for example, mw ou alors m). je must be an integer between 1 and N
m is the rank of the observation that contains the Pth percentile
mw is the whole number component of m (for example, 3 of 3.14) and
m is the decimal component of m (for example, 0.14 of 3.14).

où:
RSMEX is the RMSE in the X direction, and
RSMEOui is the RMSE in the oui direction.

où:
Xm is the set of N x coordinates being evaluated,
x'm is the corresponding set of check point X coordinates for the points being evaluated,
N is the number of X coordinate check points, and
m is the identification number of each check point from 1 through N.

où:
ouim is the set of N y coordinates being evaluated,
y'm is the corresponding set of check point oui coordinates for the points being evaluated,
N is the number of oui coordinate check points, and
m is the identification number of each check point from 1 through N.

où:
zm is the set of N z values (elevations) being evaluated,
z'm is the corresponding set of check point elevations for the points being evaluated,
N is the number of z check points, and
m is the identification number of each check point from 1 through N.


PointStacker - Random locations at different zoom level - Geographic Information Systems

Quelques-uns des nombreux changements résultant de la Loi sur les soins abordables soulignent la nécessité d'une compréhension géographique des communautés membres existantes et potentielles. Les échanges de santé exigent que les réseaux de prestataires de santé soient géographiquement accessibles aux populations mal desservies, et les hôpitaux à but non lucratif à l'échelle nationale sont tenus de procéder à des évaluations des besoins de santé de la communauté tous les trois ans. Au-delà de ces exigences, les fournisseurs de soins de santé utilisent des cartes et des analyses spatiales pour mieux traiter les résultats de santé qui sont liés de manière complexe aux facteurs sociaux et économiques.

Kaiser Permanente applique des systèmes d'information géographique, avec des analyses spatiales et des visualisations cartographiques, aux données provenant de ses dossiers médicaux électroniques et d'ensembles de données disponibles publiquement et commercialement. Les résultats aident à façonner une compréhension des besoins de santé des membres de Kaiser Permanente dans le contexte de leurs communautés. Cette compréhension fait partie d'une stratégie visant à éclairer les partenariats et les interventions dans et au-delà des cadres de prestation de soins traditionnels.

Introduction

During the past decade, the use of geographic information systems (GIS) for mapping and spatial analytics has evolved at Kaiser Permanente (KP). With roots in care delivery facilities planning, GIS next became an important part of KP's effort to illuminate disparities in care and improve quality of care. More recently, the Patient Protection and Affordable Care Act (ACA) 1 is reinforcing the need for a geographic understanding of existing and prospective member communities, including health status and outcomes, access to care, and cultural preferences. 2 For example, state and federal health exchanges require evidence that health provider networks are geographically accessible to underserved populations. 3,4 The ACA also mandates that nonprofit hospitals conduct a community health needs assessment every three years. 5 Other health systems have similarly recognized the utility of GIS to understand primary care needs at the community level 6 and to galvanize multisector collaborations to better address health outcomes that are related in complex ways to social and economic factors. 7

This article highlights two recent projects required by the ACA in which GIS played an important role: 1) measuring network adequacy and 2) conducting community health needs assessments. We also outline a GIS-based approach that uses data from KP's electronic health record (EHR) to identify neighborhood-level spatial variation in the prevalence of chronic conditions. Developed as a complement to the community health needs assessment process, the resulting hot spot maps protect patient/member confidentiality, while showing that the variation in health outcomes is often spatially correlated with social determinants across the community. Last, we discuss other uses for hot spot mapping, geospatial analytics, and the evolving role of GIS in targeting community-based disease prevention and management efforts.

In health care organizations, great care must be taken when working with protected health information using any technology. The use of GIS technology is no exception, for reasons ranging from compliance with the Health Insurance Portability and Accountability Act (HIPAA) to preventing unethical targeting of groups on the basis of race, ethnicity, or sociodemographics. For these reasons, much of our efforts focus on protecting individual confidentiality when working with data from KP members' EHRs.

Measuring Network Adequacy and Accessibility

Health exchanges are an important vehicle for making health insurance available via the ACA. The application process requires health plans to report network adequacy in geographically specific ways. For example, the Qualified Health Plan application for California's Health Benefit Exchange required time (30 minutes) and distance (15 miles) calculations from low-income populations (≤ 200% of federal poverty level) to primary care physicians across all counties where the Health Plan would offer insurance. GIS tools were used to measure accessibility via the street network between the low-income population and KP care delivery locations. Although not originally required, KP's internal project team requested maps, which were ultimately submitted as part of the application. As an example, the map for San Diego County (Figure 1, enlarged, full-color version is available online at: www.thepermanentejournal.org/images/Spring2014/GIS1.jpg) indicates that very few low-income residents live beyond a 30-minute drive to KP primary care locations.

Similarly, the federal requirements measure access to care providers by focusing on high-need zip codes. These zip codes have been designated as a Health Professional Shortage Area by the US Department of Health and Human Services Health Resources and Services Administration or have a high percentage (≥ 30%) of the population living at or below 200% of the federal poverty level. The number of primary care physicians in the Health Plan who practice in or adjacent to these high-need zip codes are compared with the number of Essential Community Providers, as defined by the Health Resources and Services Administration. 8 This measure ensures that the Health Plan provides at-risk populations with sufficient geographic access to care providers, and GIS analysis was necessary to answer the question of zip code adjacency. Although measures of network adequacy may evolve in the face of more virtual access to care (eg, telemedicine, care coordination, and broadband access in rural areas), geographically based measures of network adequacy will continue to require GIS technology for accurate measurement and reporting.

Supporting Community Health Needs Assessment

Since 1994, the state of California has required that nonprofit hospitals develop and implement community health needs assessments. 9 Starting in 2013, the ACA requires community health needs assessments for nonprofit hospitals nationwide to be repeated every three years to identify changes in health needs. 1 This requirement aligns well with KP's mission to provide high-quality, affordable health care services and to improve the health of our members and the communities we serve.

Building on years of experience with community health needs assessments in California and inspired by the ACA mandate, KP conducted a project to support the community health needs assessment process. A crossfunctional team from KP identified indicators and benchmarks, developed toolkits to outline workflows, and partnered with the Institute for People, Place & Possibility in Columbia, MO, and the Center for Applied Research and Environmental Systems at the University of Missouri, Columbia, to build a Web-based reporting and mapping tool. The resulting data platform (www.CHNA.org/KP) streamlines access to a broad set of data indicators, helping planners to explore and to learn about the health needs of a community, and to produce tables, charts, interactive maps, and reports to communicate their findings. 10 The community health needs assessment indicators are organized into categories: demographics, social and economic factors (eg, crime, education, poverty), physical environment (eg, fast food, parks, and air quality), clinical care (eg, access to preventive care), health behaviors (eg, eating fruits and vegetables), and health outcomes (eg, diabetes prevalence). Together these indicators provide insight on health outcomes and clinical care as well as upstream factors that also have an impact on health. In partnership with the Centers for Disease Control and Prevention in Atlanta, GA, the Institute for People, Place & Possibility, and the Center for Applied Research and Environmental Systems, KP has provided the CHNA.org platform as a free GIS community asset to support community health needs assessment efforts nationwide. 11

Data challenges still exist, however. Although many states are recognizing the limitations of publicly available health data and taking initial steps to address these limitations (eg, All Payer All Claims Database in Oregon and California's Free the Data initiative), many important public health statistics are still reported only at the state or county levels. From a national perspective, these statistics provide useful benchmarks, as they can be trended over time and indicate regional variation. However, overaggregation can mask underlying disparities, 12 limiting efforts to target interventions and detect changes at the local level.

Mapping Neighborhood-Level Geographic Variation in Health Outcomes

In Summer 2012, we piloted an internal project to address the lack of neighborhood-level insight regarding health outcomes across seven KP Regions in eight states (CA, CO, GA, HI, MD, OR, VA, and WA) and the District of Columbia. We used data derived from KP's EHR to produce neighborhood-level hot spot maps of disease prevalence in KP member communities for high-impact chronic conditions: adult and child obesity, asthma, diabetes, heart disease, and hypertension. We also analyzed self-reported physical activity measures, referred to as "Exercise as a Vital Sign," for several Regions. To protect member privacy while providing actionable insights, we scored neighborhoods by how their prevalence rate compared with the regional KP average rate, but no absolute rates were communicated and no member-level data were presented.

Using GIS tools, we geocoded each member's home address and aggregated member-level health outcomes to the census tract, providing an initial level of protection for member/patient identifiable information. Regions of KP range in size from a few hundred thousand to more than 3 million members, representing up to 30% or more of the total population in some census tracts. Table 1 lists the number of tracts by Region. Although perhaps imperfect for our purposes, census tracts are intended to be socioeconomically homogeneous, and they have origins in public health applications. 13 This level of aggregation provided a balance between detailed geographic measurement, adequate sample size, and individual privacy. 12 After aggregating member-level chronic conditions data into census tract rates, we used a documented approach with origins in analysis of medication adherence 14 to determine 1) whether individual tract rates stood out compared with other tracts in the Region and then 2) whether there were entire neighborhood rates that stood out compared with the KP Region.

The analysis standardized rates across census tracts to account for variability in KP member density. The resulting tract-level standardized rates (Z scores) incorporate the number of members in each tract along with the rate to indicate how many standard deviations each tract rate is from the regional rate. This highlights individual tract rates that are statistically significantly different from the overall regional rate.

To determine if there were entire neighborhoods, or groups of census tracts, with significantly higher or lower rates, it was important to first define neighborhoods. Neighborhoods were ultimately defined around each census tract as either 1) all additional census tracts within two miles, for densely populated urban areas, or 2) the two additional closest census tracts, measured from the centroid, for sparsely populated rural areas. On the basis of these neighborhood definitions, we created models in ArcGIS for Desktop (Esri, Redlands, CA) to run the Hot Spot Analysis (Getis-Ord Gi* statistic) on the standardized tract rates for each chronic condition for each Region. The Getis-Ord Gi* statistic is a Z score identifying statistically significant spatial clustering of higher and lower values. When applied to the standardized chronic condition prevalence rates, the results identify multitract hot spots where neighborhood rates significantly differ from the overall regional rate. To further protect member confidentiality, we then recategorized the hot spot Z scores into a hot spot index value for each census tract, as specified in Figure 2. Each hot spot index value corresponds to a standard deviation and confidence interval. These classifications allowed us to share actionable relative prevalence data and maps, while completely masking the actual rates.

This method revealed neighborhoods with significant spatial clustering of similar tract rates, which were either significantly higher or lower than the regional average. These results indicated that the variation in some chronic conditions across KP member communities mirrored key drivers (eg, obesity and low educational attainment Figure 3, enlarged version is available online at: www.thepermanentejournal.org/images/Spring2014/GIS3.jpg). Although some of these associations have been previously described in published studies, 15-17 this approach systematically identified and quantified the geographic variation and generated compelling visualizations that both protected individual member data and were easily understood by nontechnical audiences.

Additional Cases Using Geographic Information Systems

The hot spot modeling method and maps described earlier were initially developed to complement a robust ACA-mandated community health needs assessment process, but KP clinicians are finding new uses for them. We have recently used this approach to 1) inform planning efforts for prediabetes interventions in Georgia and the Northwest, 2) support the case for investment in an at-home healthy meals delivery program for patients with heart failure after discharge in the San Francisco Bay Area, and 3) identify KP communities where fewer people get a flu vaccine to target efforts to increase vaccination rates in Southern California.

In the future, GIS could play a vital role in improving clinical operations. In the spirit of the work done at the University of Florida Family Data Center, we are mapping heart attack risk in KP member communities across San Diego to help target deployment of a mobile health van. 7 In addition, an early prototype has indicated some value for using GIS-based route planning tools to help optimize the work of home health care providers. Although this application is nascent at KP, related work has documented benefits such as reduced cost via reduced travel time for providers as well as improved patient satisfaction. 18

Evolving Opportunities

Care transformation is likely to happen on multiple scales, from the clinical care team to the community. Insight and information based on GIS could help by supplementing decision support for care teams, informing partnerships with planning and public health agencies, and empowering communities to improve their health collectively.

GIS can supplement decision support for clinical care teams. Care teams are increasingly prescribing walking as a therapy for chronic conditions. After-visit summaries or patient-facing tools could include suggestions for walking routes or other healthy lifestyle resources near the patient's home or work. GIS also have been used to investigate patterns of community-acquired methicillin-resistant Staphylococcus aureus, for which geographic area proved to be a significant risk factor for children presenting with this infection. 19 The authors suggested that this information could guide antibiotic selection before culture results are available. 19

GIS maps and analyses support a common language that can inform partnerships with local planning and public health agencies and affect policy change. Health in All Policies: A Guide for State and Local Governments outlines ways in which decisions made in sectors such as transportation, education, and economic development affect health. The policy suggests that "better health can support the goals of these multiple sectors." 20 Regional Equity Atlases, such as those available for Portland, OR Denver, CO and Atlanta, GA, provide another example of the use of GIS to communicate interrelationships between planning sectors, social determinants, and health outcomes that can help galvanize policy change.

Finally, and perhaps most important, GIS can help empower community members to improve their health collectively. Learning what is already working in some neighborhoods can inform strategies in neighborhoods that face similar social determinants. Increasingly, crowdsourcing is used to allow people to vote online, in a geographically specific way, on investments that are important to them. Portland Bike Share is one example. 21 The same could be done for understanding which neighborhood-level investments would help people become or stay healthy, be it a grocery store, improved park, or better access to transportation.

Conclusion

Use of GIS at KP has evolved over the years and has recently become important for regulatory aspects of health care reform related to network adequacy and community health needs assessment. As part of these efforts, we identified systemic variation in the prevalence of chronic conditions across KP member communities at the census tract and neighborhood levels. This geographic variation is not random, suggesting that geographically informed interventions may be part of a multifaceted solution. Furthermore, these results are generating interest in other parts of KP to understand the effects of place and to respond accordingly. These findings reinforce Ethan Berke, MD's call for "place as a vital sign." 22 GIS make it possible to give geographic context to data from an EHR, understand individual health in the context of community health, and begin to assess the importance of place as a vital sign. Within KP, the use of GIS is growing, results are compelling, and engagement is high.

Disclosure Statement

The author(s) have no conflicts of interest to disclose.

Acknowledgment

The authors would like to thank Pamela Schwartz, MPH, and Jean Nudelman, MPH, for leadership in developing the Community Health Needs Assessment platform and for providing constructive feedback during refinement of the hot spot methodology.

Kathleen Louden, ELS, of Louden Health Communications provided editorial assistance.

Les références

1. The Patient Protection and Affordable Care Act of 2010. Public Law 111-148, 111th Congress, 124 Stat 119, HR 3590, enacted 2010 Mar 23.

2. Kehoe B. Mapping out care delivery with an assist from GIS. Hosp Health Netw 2011 Jan85(1):16-7.

3. California health benefit exchange [Internet]. Sacramento, CA: National Business Coalition on Health 2012 Nov 16 [amended 2012 Dec 28 cited 2013 Aug 27]. Available from: www.healthexchange.ca.gov/Solicitations/Documents/FINAL%20SOLICITATION%2011-16-12%20updated%2012-28-12.pdf. p 25.

4. Supplementary response: inclusion of essential community providers [Internet]. Baltimore, MD: Centers for Medicare & Medicaid Services 2013 Mar 8 [cited 2013 Aug 27]. Available from: www.cms.gov/CCIIO/Programs-and-Initiatives/Files/Downloads/ecp_supplemental_response_Form_03_08_13.pdf. p 3.

5. New requirements for 501(c)(3) hospitals under the Affordable Care Act [Internet]. Washington, DC: Internal Revenue Service updated 2013 Nov 7 [cited 2013 Aug 27]. Available from: www.irs.gov/Charities-&-Non-Profits/Charitable-Organizations/New-Requirements-for-501%28c%29%283%29-Hospitals-Under-the-Affordable-Care-Act.

6. Dulin MF, Ludden TM, Tapp H, et al. Using Geographic Information Systems (GIS) to understand a community's primary care needs. J Am Board Fam Med 2010 Jan-Feb23(1):13-21. DOI: http://dx.doi/org/10.3122/jabfm.2010.01.090135.

7. Hardt NS, Muhamed S, Das R, Estrella R, Roth J. Neighborhood-level hot spot maps to inform delivery of primary care and allocation of social resources. Perm J 2013 Winter17(1):4-9. DOI: https://doi.org/10.7812/TPP/12-090.

8. Essential community providers [Internet]. Rockville, MD: Health Resources and Services Administration, HIV/AIDS Programs 2013 [cited 2013 Dec 5]. Available from: http://hab.hrsa.gov/affordablecareact/ecp.html.

9. Not-for-profit hospital community benefit legislation. SB 697, CA Stat of 1994 ch 812, §127340-127365.

10. CHNA data platform: background [Internet]. Oakland, CA: Kaiser Permanente 2013 [cited 2013 Aug 27]. Available from: http://assessment.communitycommons.org/KP/Background.aspx.

11. Resources for implementing the community health needs assessment process [Internet]. Atlanta, GA: Centers for Disease Control and Prevention, Office of the Associate Director for Policy 2013 Sep 11 [cited 2013 Aug 27]. Available from: www.cdc.gov/policy/chna/.

12. Krieger N, Chen JT, Waterman PD, Soobader MJ, Subramanian SV, Carson R. Geocoding and monitoring of US socioeconomic inequalities in mortality and cancer incidence: does the choice of area-based measure and geographic level matter?: the Public Health Disparities Geocoding Project. Am J Epidemiol 2002 Sep 1156(5):471-82. DOI: https://doi.org/10.1093/aje/kwf068.

13. Krieger N. A century of census tracts: health & the body politic (1906-2006). J Urban Health 2006 May83(3):355-61. DOI: https://doi.org/10.1007/s11524-006-9040-y.

14. Hoang C, Kolenic G, Kline-Rogers E, Eagle KA, Erickson SR. Mapping geographic areas of high and low drug adherence in patients prescribed continuing treatment for acute coronary syndrome after discharge. Pharmacotherapy 2011 Oct31(10):927-33. DOI: https://doi.org/10.1592/phco.31.10.927.

15. Link BG, Phelan J. Social conditions as fundamental causes of disease. J Health Soc Behav 1995Spec No:80-94.


Semantics Geographic information system_section_28

Tools and technologies emerging from the World Wide Web Consortium's Semantic Web are proving useful for data integration problems in information systems. Geographic information system_sentence_298

Correspondingly, such technologies have been proposed as a means to facilitate interoperability and data reuse among GIS applications. Geographic information system_sentence_299

and also to enable new analysis mechanisms. Geographic information system_sentence_300

Ontologies are a key component of this semantic approach as they allow a formal, machine-readable specification of the concepts and relationships in a given domain. Geographic information system_sentence_301

This in turn allows a GIS to focus on the intended meaning of data rather than its syntax or structure. Geographic information system_sentence_302

For example, reasoning that a land cover type classified as deciduous needleleaf trees in one dataset is a specialization or subset of land cover type forest in another more roughly classified dataset can help a GIS automatically merge the two datasets under the more general land cover classification. Geographic information system_sentence_303

Tentative ontologies have been developed in areas related to GIS applications, for example the hydrology ontology developed by the Ordnance Survey in the United Kingdom and the SWEET ontologies developed by NASA's Jet Propulsion Laboratory. Geographic information system_sentence_304

Also, simpler ontologies and semantic metadata standards are being proposed by the W3C Geo Incubator Group to represent geospatial data on the web. Geographic information system_sentence_305

GeoSPARQL is a standard developed by the Ordnance Survey, United States Geological Survey, Natural Resources Canada, Australia's Commonwealth Scientific and Industrial Research Organisation and others to support ontology creation and reasoning using well-understood OGC literals (GML, WKT), topological relationships (Simple Features, RCC8, DE-9IM), RDF and the SPARQL database query protocols. Geographic information system_sentence_306

Recent research results in this area can be seen in the International Conference on Geospatial Semantics and the Terra Cognita – Directions to the Geospatial Semantic Web workshop at the International Semantic Web Conference. Geographic information system_sentence_307


PointStacker - Random locations at different zoom level - Geographic Information Systems

To assess the impact of geographic health services factors on the timely diagnosis of autism.

Méthodes

Children residing in central North Carolina were identified by records-based surveillance as meeting a standardized case definition for autism. Individual-level geographic access to health services was measured by the density of providers likely to diagnose autism, distance to early intervention service agencies and medical schools, and residence within a Health Professional Shortage Area. We compared the presence of an autism diagnosis by age 8 and timing of first diagnosis across level of accessibility, using Poisson regression and Cox proportional hazards regression and adjusting for family and neighborhood characteristics.

Résultats

Of 206 identified cases, 23% had no previous documented diagnosis of autism. Most adjusted estimates had confidence limits including the null. Point estimates across analyses suggested that younger age at diagnosis was found for areas with many neurologists and psychiatrists and proximal to a medical school but not areas with many primary care physicians or proximal to early intervention services agencies.

Conclusion

Further study of the distribution of medical specialists diagnosing autism may suggest interventions to promote the early diagnosis, and initiation of targeted services, for children with autism spectrum disorders.


Normal Hotspots vs Clumpy Ones in Raleigh

The open data I use for Raleigh, North Carolina for the NIBRS dataset goes back to June 2014, and has data updated in the beginning of March 2021. I pull out larcenies from motor vehicles, and for the historical train dataset use car larcenies from 2014 through 2019 (n = 17,681). For the test dataset I use car larcenies in 2020 and what is available so far in 2021 (n = 3,376). Again these are grid cells generated over the city boundaries at 500 by 500 foot intervals. For illustration I grab out the top 1% of the city (209 grid cells). I use a train/test dataset as out of sample test data will typically result in reduced predictions. Here are the PAI stats for train vs test when selecting the top 1%.

For all subsequent selections I always use the historical training data to select the hot spots, and the test dataset to evaluate the PAI.

If we do the typical approach of just taking the highest crime grid cells based on the historical data, here are the results both for the PAI and the CI (clumpy index). For those not familiar, PAI is % Crime Capture/% Area , so if the denominator is 1%, and the PAI (for the test data) is 17, that means the hot spots capture 17% of the total thefts from vehicles. The CI ranges from -1 (spread apart) to 1 (entirely clustered). Here it is just over 0, suggesting these are basically randomly distributed in terms of clustering.

You may think that almost spatial randomness in terms of clumping seems at odds with that crime clusters! But it is not really – a consistent relationship with crime hot spots is that they are intensely localized, and often you can go down the street and be in a low crime area (Harries, 2006). The same idea when people say high crime neighborhoods often are spotty interior – they tend to have mostly low crime areas and just a few specific hot spots.

OK, so now to show off my linear program. So what happens if we use theta=0.9 ?

The total crime numbers are here for the historical data, and it ends up capturing the exact same number of crimes as the select top 1% does (3,664). But, it switches the selection of one of the areas. So what happens here is that we have ties – even with basically little weight assigned to the interior connections, it will prioritize tied crime areas to be connected to other chosen hot spots (whereas before the ties are just random in the way I chose the top 1%). So if you have many ties at the threshold for your hot spot, this is a great way to prioritize particular tied areas.

What happens if we turn down theta to 0.5? So this is saying you would trade off one for one – one interior edge is equal to one crime.

You can see that it changed the selections slightly more here, traded off 24 areas compared to the original just rank solution. Lets check out the map and the CI:

The CI value is now 0.17 (up from 0.08). You can see some larger blobs, but it is still pretty spread apart. But the reduction in the total number of crimes captured is pretty small, going from a PAI of 17 to now a PAI of 16. How about if we crank down theta even more to 0.2?

This trades off a much larger number of areas and total amount of crime – over half of the chosen grid cells are flipped in this scenario. In the subsequent map you can see the hot spots are much more clumpy now, and have a CI of 0.64.

The PAI of 12.6 is a bit of a hit as well, but is not too shabby still. I typically take a PAI of 10 to be the ballpark of what is reasonable based on Weisburd’s Law of Crime Concentration – 5% of the areas contain 50% of the crime (which is a PAI of 10).

So this shows one linear programming approach to trade off clumpy chosen areas vs disconnected speckles over the map. It may be the case though that other approaches are more reasonable, such as using some type of clustering to begin with. Par exemple. I could use DBSCAN on the gridded predicted values (Wheeler & Reuter, 2020) as see how clumpy those hot spots are. This approach is nice though if you have a fixed area you want to cover though.


Revisiting the estimations of PM2.5-attributable mortality with advancements in PM2.5 mapping and mortality statistics

With the advancements of geospatial technologies, geospatial datasets of fine particulate matter (PM2.5) and mortality statistics are increasingly used to examine the health effects of PM2.5. Choices of these datasets with difference geographic characteristics (e.g., accuracy, scales, and variations) in disease burden studies can significantly impact the results. The objective of this study is to revisit the estimations of PM2.5-attributable mortality by taking advantage of recent advancements in high resolution mapping of PM2.5concentrations and fine scale of mortality statistics and to explore the impacts of new data sources, geographic scales, and spatial variations of input datasets on mortality estimations. We estimate the PM2.5-mortality for the years of 2000, 2005, 2010 and 2015 using three PM2.5 concentration datasets [Chemical Transport Model (CTM), random forests-based regression kriging (RFRK), and geographically weighted regression (GWR)] at two resolutions (i.e., 10 km and 1 km) and mortality rates at two geographic scales (i.e., regional-level and county-level). The results show that the estimated PM2.5-mortality from the 10 km CTM-derived PM2.5 dataset tend to be smaller than the estimations from the 1 km RFRK- and GWR-derived PM2.5 datasets. The estimated PM2.5-mortalities from regional-level mortality rates are similar to the estimations from those at county level, while large deviations exist when zoomed into small geographic regions (e.g., county). In a scenario analysis to explore the possible benefits of PM2.5 concentrations reduction, the uses of the two newly developed 1 km resolution PM2.5 datasets (RFRK and GWR) lead to discrepant results. Furthermore, we found that the change in PM2.5 concentration is the primary factor that leads to the PM2.5-attributable mortality decrease from 2000 to 2015. The above results highlight the impact of the adoption of input datasets from new sources with varied geographic characteristics on the PM2.5-attributable mortality estimations and demonstrate the necessity to account for these impact in future disease burden studies.

Capsule

We revisited the estimations of PM2.5-attributable mortality with advancements in PM2.5 mapping and mortality statistics, and demonstrated the impact of geographic characteristics of geospatial datasets on mortality estimations.


Voir la vidéo: FORTNITE COMMENT REGLER LE BUG DE ZOOM! (Octobre 2021).