Suite

Géocoder à l'aide d'ArcGIS Desktop ?


J'ai un ensemble de données d'entités administratives (polygones) avec 3 niveaux : Admin 1 - Province, Admin 2 - District et Admin 3 - Commune.

Maintenant, je veux faire un processus de géocodage d'une table d'adresses qui se compose de 3 colonnes : Admin1, Admin2, Admin3 comme les 3 niveaux ci-dessus. Au cas où un enregistrement de la table aurait une adresse complète, il renverrait le centroïde de Admin3, si la colonne Admin3 est vide, il devrait renvoyer le centroïde de Admin 2 et si les deux Admin3 et Admin2 sont vides, le résultat devrait être le centroïde de Admin1.

Des idées pour effectuer cette tâche dans ArcGIS Desktop ?


Dans ArcGIS, je pense qu'un localisateur d'adresses composite fera ce que vous voulez. Vous créez d'abord un localisateur d'adresses distinct pour chacun de vos niveaux d'administration, puis configurez un localisateur d'adresses composite à l'aide des trois localisateurs d'administrateur. Vous classez vos localisateurs d'adresses dans le localisateur composite afin qu'il examine d'abord admin 3, s'il n'y trouve pas de correspondance, il passe à admin 2, et ainsi de suite.


Les données ArcGIS sont organisées dans des dossiers et des connexions d'espace de travail

Les dossiers d'espace de travail et les connexions aux bases de données, aux sites ArcGIS Server et aux portails constituent les principaux conteneurs pour stocker et gérer les informations géographiques pour ArcGIS. Les dossiers d'espace de travail sont simplement des dossiers de fichiers sur disque qui contiennent de nombreuses géodatabases fichier et personnelles, des jeux de données basés sur des fichiers et une série de documents ArcGIS.

L'un des dossiers clés de l'espace de travail dans ArcMap est le dossier d'accueil de chaque carte, qui est l'emplacement utilisé par défaut pour stocker votre carte, enregistrer les résultats et créer de nouveaux jeux de données.

Les dossiers d'espace de travail peuvent contenir des jeux de données externes dans de nombreux formats de fichier ainsi que des références à des géodatabases. Par exemple, vous pouvez utiliser des géodatabases fichier, vous connecter à des géodatabases et bases de données d'entreprise et travailler avec des dossiers contenant de nombreux fichiers de données, tels que des fichiers de formes et des couvertures Esri, des images JPEG, des fichiers CAO DXF, des tables dBASE, des feuilles de calcul Excel et des fichiers de données GML. .

Vous organisez vos jeux de données et vos documents ArcGIS dans une série de dossiers de système de fichiers (souvent appelés dossiers d'espace de travail) et de connexions. L'organisation des jeux de données par dossiers d'espace de travail et base de données, sites ArcGIS Server et connexions au portail est utile car elle fournit un mécanisme pour effectuer les opérations suivantes :

  • Contrôler l'accès aux ensembles de données.
  • Fournir un cadre de transaction pour la mise à jour et le partage des ensembles de données.
  • Organisez, documentez et cataloguez de nombreux ensembles de données géographiques.

Les contenus typiques peuvent inclure ceux-ci :

  • Documents ArcMap ( .mxd )
  • Documents ArcGlobe ( .3dd )
  • Fichiers de calque ( .lyr )
  • Scripts Python ( .py )
  • Imagerie (telle que les fichiers .jpg et .tif)

Les applications ArcGIS utilisent une série de documents pour enregistrer le travail créé dans ArcGIS. Ces documents définissent comment les cartes, les éléments cartographiques, les couches de carte, les globes, les éléments de globe et les modèles de géotraitement sont gérés et utilisés dans le logiciel. Par exemple, une carte précise l'ensemble des couches cartographiques contenues dans une carte ainsi que les éléments de mise en page de la carte et leurs propriétés d'affichage utilisées pour présenter les jeux de données SIG. Une fois que vous avez créé un document ArcMap, vous pouvez l'utiliser simplement en double-cliquant sur le nom du document pour l'ouvrir. Cela lancera l'application ArcMap pour la carte sélectionnée.

Chaque document ArcGIS est enregistré en tant que fichier dans un dossier de disque.

Certains des documents ArcGIS couramment utilisés trouvés dans les dossiers de l'espace de travail

Double-cliquez pour ouvrir dans ArcMap .

Fichier contenant une carte, ses couches, des informations d'affichage et d'autres éléments utilisés dans ArcMap .

Double-cliquez pour ouvrir dans ArcMap . Il est utilisé pour partager des cartes et des données avec d'autres utilisateurs et pour le partage sur les portails ArcGIS Online et ArcGIS Enterprise.

Une carte plus une géodatabase pour le contenu de la carte. La carte fournit toutes ses spécifications et la géodatabase fournit les données réelles utilisées dans la carte.

Double-cliquez pour ouvrir dans ArcGlobe .

Fichier contenant un globe, ses couches et des propriétés d'affichage 3D à utiliser dans ArcGlobe , qui fait partie de l'extension 3D Analyst.

Double-cliquez pour ouvrir dans ArcScene .

Fichier contenant une scène 3D, ses couches et ses propriétés 3D à utiliser dans ArcScene , qui fait partie de l'extension ArcGIS 3D Analyst .

Utilisé pour publier des services avec ArcGIS Server .

Créé dans ArcMap et enregistré à l'aide de la fenêtre Enregistrer une définition de service.

Utilisé pour enregistrer un brouillon d'une définition de service.

Créé dans ArcMap et enregistré à l'aide de la fenêtre Enregistrer une définition de service.

Faites glisser dans ArcMap , ArcGlobe , ArcScene et ArcGIS Explorer Desktop .

Une couche est un ensemble de règles permettant d'afficher et d'utiliser des jeux de données dans ArcMap et ArcGlobe . Les définitions de couche incluent les affectations de symboles, les classifications, les règles d'étiquetage et d'autres propriétés d'utilisation de la carte.

Faites glisser dans ArcMap , ArcGlobe , ArcScene et ArcGIS Explorer Desktop .

Un paquetage de couches est une couche de carte plus ses données regroupées. Les packages de couches sont utilisés pour partager à la fois les données et leur cartographie.

Utilisé pour le géocodage dans ArcGIS.

Un jeu de données de localisation et des règles utilisées pour le géocodage des adresses dans ArcGIS. Les localisateurs peuvent être enregistrés sous forme de fichier sur disque pour être partagés et utilisés.

Apparaît comme une boîte à outils. Dans ArcGIS Desktop , il ouvre un dossier de boîte à outils contenant des modèles et des scripts de géotraitement. Il est également utilisé pour publier des outils de géotraitement sur ArcGIS Server .

Collections de modèles de géotraitement enregistrées et partagées à l'aide de fichiers de boîte à outils.


Top 6 des fournisseurs sur le marché SIG de 2017 à 2021 : Technavio

LONDRES--( BUSINESS WIRE )--Technavio a annoncé les six principaux fournisseurs dans leur récent marché mondial des SIG rapport. Ce rapport de recherche répertorie également huit autres fournisseurs de premier plan qui devraient avoir un impact sur le marché au cours de la période de prévision.

Le marché mondial des SIG augmentera à un TCAC de 10,53 % au cours de la période de prévision. Le logiciel SIG est utilisé pour la cartographie, le géocodage, le routage, la modélisation, la création de rapports, l'analyse et la gestion des données. Les utilisateurs finaux de tous les secteurs comptent sur le SIG pour améliorer leur productivité, leur capacité de prise de décision et leurs normes de sécurité et de sûreté. Les pays en développement tels que la Chine, le Brésil, l'Inde, l'Indonésie et la Corée du Sud connaîtront une forte croissance du marché au cours de la période de prévision. Cependant, la croissance du marché est principalement tirée par l'intérêt croissant manifesté par le secteur public dans les pays développés tels que les États-Unis, le Canada, l'Allemagne et la France.

Paysage concurrentiel des fournisseurs

le marché mondial des SIG est fragmenté avec la présence de nombreux fournisseurs. Le marché est caractérisé par la présence de vendeurs internationaux, régionaux et locaux bien diversifiés. Sur ce marché, de nombreux fournisseurs locaux et régionaux proposent différents logiciels, données et services SIG à un prix comparativement inférieur à celui des fournisseurs internationaux.

Bien que de nouveaux fournisseurs émergent sur ce marché, ils ont du mal à rivaliser avec les fournisseurs internationaux en termes de qualité, de fonctionnalités, de fonctionnalités et de services. L'environnement concurrentiel de ce marché va s'intensifier avec l'augmentation des extensions de services, des innovations technologiques et des fusions et acquisitions, explique Ishmeet Kaur, un la gestion du cycle de vie du produit analyste de Technavio.

Les exemples de rapports de Technavio sont gratuits et contiennent plusieurs sections du rapport, notamment la taille et les prévisions du marché, les moteurs, les défis, les tendances, etc.

Les six principaux fournisseurs du marché SIG

Autodesk est une société de logiciels et de services de conception. Elle sert des clients dans les secteurs de l'architecture, de l'ingénierie, de la construction, de la fabrication, des médias numériques, de la consommation et du divertissement dans le monde entier. La société mène sa R&D principalement au Canada, en Chine, à Singapour et aux États-Unis.

La stratégie de croissance d'Autodesk consiste davantage à fournir des logiciels de bureau et des logiciels interopérables via des licences flexibles, des combinaisons de produits et des services sociaux et cloud. Autodesk propose plusieurs produits accessibles via le Web, le cloud et les appareils mobiles.

ESRI propose un système d'information géographique, des logiciels associés et des produits d'analyse géospatiale utilisant la plate-forme ArcGIS. Il dessert différentes industries, notamment les entreprises, le gouvernement, les services publics, les communications et d'autres industries. Elle compte plus de 350 000 clients dans le monde et a un partenariat avec plus de 1 800 entreprises. La société a une large présence couvrant l'Afrique, l'Antarctique, l'Asie, l'Europe, l'Amérique du Nord, l'Océanie et l'Amérique du Sud.

Hexagon est un fournisseur de technologies intégrées de conception, de mesure et de visualisation. Il permet à ses clients de mesurer et de positionner des objets, de concevoir, de traiter et de présenter des données grâce à ses technologies pour garder une longueur d'avance.

MDA offre des informations basées au sol et dans l'espace à un certain nombre d'utilisateurs finaux, en particulier les agences et organisations gouvernementales et militaires. La société a deux divisions commerciales : Communications et Surveillance et Renseignement. Le segment des communications fournit des solutions satellitaires, des charges utiles satellitaires et plusieurs autres produits de communication aux utilisateurs finaux commerciaux et gouvernementaux. Par le biais du segment de la surveillance et du renseignement, la société fournit des produits à valeur ajoutée, des images satellite et des produits connexes.

Pitney Bowes est l'un des plus importants fournisseurs d'équipement géospatial et de services postaux en Amérique du Nord. Les activités du segment des solutions pour les petites et moyennes entreprises sont en outre classées en deux sous-segments, à savoir le courrier en Amérique du Nord et le courrier international. Le secteur du courrier en Amérique du Nord comprend les produits et les dépenses connexes provenant de la location, de la vente et du financement de matériel et de fournitures de courrier fournis aux petites et moyennes entreprises pour formuler le courrier et l'affranchissement des preuves au Canada et aux États-Unis.

SuperMap est l'un des plus grands fournisseurs de SIG en Asie et est basé à Hong Kong, en Chine. La société fournit des logiciels et des services SIG pour différentes exigences telles que la gestion des installations, la gestion des terres, le développement de villes intelligentes, la protection de l'environnement et l'immobilier. La société fournit des services SIG de bureau, SIG mobiles et SIG.

Parcourir les rapports connexes :

Devenir un Membre Technavio Insights et accédez à ces trois rapports pour une fraction de leur coût initial. En tant que membre Technavio Insights, vous aurez un accès immédiat aux nouveaux rapports au fur et à mesure de leur publication en plus des 6 000+ rapports existants couvrant des segments tels que Cloud computing, centre de données, et Matériel informatique. Cet abonnement vous permet de réaliser des milliers d'économies, tout en restant connecté à la bibliothèque de recherche en constante évolution de Technavio, vous aidant à prendre des décisions commerciales éclairées plus efficacement.

Technavio est l'une des principales sociétés mondiales de recherche et de conseil en technologie. L'entreprise développe chaque année plus de 2000 recherches, couvrant plus de 500 technologies dans 80 pays. Technavio compte environ 300 analystes dans le monde qui se spécialisent dans les missions de conseil et de recherche commerciale personnalisées sur les dernières technologies de pointe.

Les analystes de Technavio utilisent des techniques de recherche primaires et secondaires pour déterminer la taille et le paysage des fournisseurs sur une gamme de marchés. Les analystes obtiennent des informations en utilisant une combinaison d'approches ascendantes et descendantes, en plus d'utiliser des outils de modélisation de marché internes et des bases de données propriétaires. Ils corroborent ces données avec les données obtenues auprès de divers acteurs du marché et parties prenantes tout au long de la chaîne de valeur, y compris les vendeurs, les prestataires de services, les distributeurs, les revendeurs et les utilisateurs finaux.


Préparer des données et des cartes pour le SIG

  • Importer des données Excel vers un SIG. : meilleures pratiques lors de l'utilisation de fichiers Excel avec ArcGIS (ESRI) et de la création d'un fichier de géodatabase
  • Afficher les données XY dans une feuille de calcul dans le logiciel ArcGIS (via Mason)
  • Créer une géodatabase fichier et définir des géodatabases par défaut à partir de données de feuille de calcul dans ArcGIS (Duke Univ.)

Géocodage: un processus pour convertir les adresses en coordonnées (latitude (X) et longitude (Y))

  • Census Geocoder (via le Bureau of Census) : pour géocoder jusqu'à 10 000 adresses à la fois. Trouvez également le comté, les secteurs de recensement et les blocs pour une adresse ou des coordonnateurs géographiques (XY). Voir le tutoriel.
  • Géocodage dans ArcGIS Online : convertissez des données d'adresse de rue par lots en données ponctuelles (besoin d'un compte institutionnel de l'Université George Mason pour accéder à cet outil). Voir le tutoriel (via Mason)
  • Voir aussi ce tutoriel (via Mason) lors de la création d'un service de localisation avec le logiciel ArcGIS Desktop (pas besoin d'utiliser un compte institutionnel pour géocoder les adresses)
  • Voir aussi via Linda.com-Géocodage d'une adresse ou de coordonnées (Besoin de Mason NetID pour y accéder)

Géoréférencement: un processus pour convertir des images cartographiques imprimées ou numérisées en cartes géoréférencées à utiliser dans l'analyse SIG.

  • Utilisation d'ArcMap (dans ArcGIS) : utilisez tous les didacticiels fournis par UC-Berkely, Mason, Brown, didacticiel vidéo (Texas AM)
  • Utilisation de QGIS : utilisez les didacticiels fournis par QGIS 2.18, les historiens de la programmation, Bibliothèque nationale d'Écosse.

Projections cartographiques : représentant des données terrestres tridimensionnelles en données bidimensionnelles basées sur divers modèles.


Limitations des attributs

  • Contrairement aux autres formats, les fichiers de formes stockent les attributs numériques au format caractère plutôt qu'au format binaire. Pour les nombres réels (c'est-à-dire les nombres contenant des décimales), cela peut entraîner des erreurs d'arrondi. Cette limitation ne s'applique pas aux coordonnées de forme, uniquement aux attributs. Le tableau suivant résume la largeur de champ pour chaque type de données d'attribut.

Largeur du champ dBASE (nombre de caractères)

Si vous devez prendre en charge Unicode dans vos noms de champ ou valeurs de champ, nous vous suggérons fortement d'utiliser des géodatabases plutôt que des fichiers de formes.

Type de données contenant une valeur nulle

Nombre—Lorsque l'outil requiert un NULL, un infini ou un NaN (Npas une Nombre) à sortir

-1.7976931348623158e+308 (norme IEEE pour la valeur négative maximale)

Nombre (tous les autres outils de géotraitement)

Stocké comme zéro, mais affiche "<null>"

  • Les noms de champs ne peuvent pas dépasser 10 caractères.
  • La longueur d'enregistrement maximale d'un attribut est de 4 000 octets. La longueur d'enregistrement est le nombre d'octets utilisés pour définir tous les champs, et non le nombre d'octets utilisés pour stocker les valeurs réelles.
  • Le nombre maximum de champs est de 255. Une conversion en shapefile convertira les 255 premiers champs si cette limite est dépassée.
  • Le fichier dBASE doit contenir au moins un champ. Lorsque vous créez un nouveau fichier de formes ou une table dBASE, un champ ID entier est créé par défaut.
  • Les fichiers dBASE ne prennent pas en charge les types de champs de type blob, guid, global ID, coordonner ID ou raster.
  • Les fichiers dBASE ont peu de support SQL à part une clause WHERE.
  • Les index d'attributs sont supprimés lorsque vous enregistrez les modifications et vous devez les recréer à partir de zéro.

   3. Sources de contexte géospatial à partir du contenu

Le contexte géospatial peut être reconnu à partir du contenu par un grand nombre d'indices, avec des degrés de précision et de fiabilité variables. Par exemple, une source évidente d'un contexte géographique grossier découle du choix de la langue utilisée pour le contenu. L'utilisation du chinois dans une page Web n'implique pas en soi que la page a un contexte géographique en Chine, mais la corrélation entre la géographie et la langue est encore assez élevée. La reconnaissance de la langue à partir d'une ressource est facilitée par un certain nombre de facteurs, notamment les balises META dans les pages HTML, les en-têtes de réponse HTTP et l'analyse linguistique directe.

Afin d'attribuer un contexte géographique plus précis aux ressources Web, nous avons conçu plusieurs stratégies d'analyse de contenu pour reconnaître des indicateurs plus spécifiques. Le reste de cette section est consacré à la discussion de certains d'entre eux.

Les adresses postales sont généralement segmentées en une variété de champs, séparés par des virgules ou des sauts de ligne. Ils peuvent être relatifs, en supposant par exemple que le lecteur sait déjà que l'adresse est aux États-Unis, et en omettant le pays. Ils contiennent souvent des fautes d'orthographe ou des variations de format. Le logiciel permettant d'effectuer cette analyse est plus compliqué qu'on ne pourrait s'y attendre, en raison de la grande variation des abréviations, de la ponctuation, des sauts de ligne et des autres fonctionnalités utilisées.

Une fois qu'une adresse postale a été reconnue et analysée, elle doit être géocodée dans un système de coordonnées tel que la latitude et la longitude. Ce n'est pas toujours facile, car une adresse postale au sein d'une grande organisation peut ne pas localiser l'emplacement avec une grande précision. À titre d'exemple, le campus de l'Université de Stanford s'étend sur plusieurs kilomètres et les emplacements des points individuels sur le campus sont gérés par le système de distribution du courrier local.

Les services de livraison postale des pays plus avancés maintiennent généralement des bases de données de toutes les adresses livrables et tentent de canoniser l'adresse écrite sur un courrier pour l'associer à un identifiant unique pour la livraison locale. Certains pays maintiennent également des bases de données qui spécifient les informations de coordonnées, et certaines sont disponibles à l'achat. Aux États-Unis, le service postal distribue un produit appelé Tiger/Zip+4 contenant environ 35 millions d'enregistrements et spécifiant une plage d'adresses pour chaque code postal à 9 chiffres livrable. En combinant cela avec l'ensemble de données TIGER (Topologically Integrated and Geographic Encoding and Reference System) du département du recensement, il est possible de récupérer une latitude et une longitude pour un point associé à chaque adresse livrable unique aux États-Unis. Ces ensembles de données sont reconditionnés et vendus par plusieurs fournisseurs de données commerciaux. Malheureusement, les codes postaux à neuf chiffres + 4 ne sont pas utilisés universellement aux États-Unis, et les anciens codes postaux à cinq chiffres sont beaucoup plus courants.

Notez que les ensembles de données mentionnés précédemment ne fournissent que des emplacements de points. Le service postal américain a développé une base de données de limites polygonales appelées ZIP Code Tabulation Areas (ZCTA). Cela permettra de déterminer encore mieux la région associée à un code postal.

Au Royaume-Uni, l'Ordnance Survey propose des licences sur une base de données de points d'adresse qui référence 25 millions de points de localisation. En outre, ils proposent un produit appelé Code-Point qui donne les coordonnées des 1,6 million de codes postaux différents en Angleterre, en Écosse et au Pays de Galles. Chaque code postal contient en moyenne une quinzaine d'adresses contiguës. La résolution de ces données est de 1 mètre.

Il ne fait aucun doute que de tels ensembles de données sont également disponibles pour d'autres pays, mais il n'existe pas de source unique de ces données. Une difficulté majeure dans l'utilisation de ces sources de données est le fait que chacune a un format non standard, et qu'elles doivent être retraitées dans un format cohérent afin d'être combinées dans un système global de web mining. De plus, chaque base de données est dynamique et un mécanisme doit être construit pour ingérer les mises à jour. Cependant, il ne suffit pas d'ingérer des mises à jour, car le contenu Web peut rester statique et faire référence à ce qui se trouvait à l'adresse au moment de la création de l'URL. Si l'on prend ces facteurs en compte, la tâche de maintenir une source fiable d'informations sur l'emplacement des points à partir des adresses peut être intimidante.

Dans notre système prototype, nous avons utilisé une petite base de données de codes postaux américains et des valeurs de latitude/longitude associées pour le centroïde de chaque région. Les codes postaux américains sont soit des chaînes numériques à cinq chiffres, soit des chaînes numériques à neuf chiffres. Un code postal moyen à cinq chiffres couvre une superficie d'environ 120 miles carrés, mais la taille médiane n'est que d'environ 40 miles carrés. Le plus grand fait environ 27 000 milles carrés (code postal 99723 dans le nord de l'Alaska). Tous les États-Unis ne sont pas couverts par des codes postaux et leurs limites ne sont pas bien définies. Nous avons utilisé un analyseur flex pour reconnaître les codes postaux dans les pages, mais afin d'éviter trop de faux positifs, nous avons exigé que le code postal soit immédiatement précédé d'une référence à l'état associé. En d'autres termes, nous n'avons pas accepté le 95120 comme code postal légitime à moins qu'il ne soit précédé d'un espace blanc et de l'une des nombreuses représentations de l'État de Californie, notamment « Calif. », « Cal. » ou « » 'CA''.

La reconnaissance des numéros de téléphone dans les pages Web n'est pas totalement infaillible, car ils peuvent être confondus avec divers autres numéros tels que les numéros de série ou les numéros de pièce. De plus, il existe plusieurs manières standard de coder un numéro de téléphone, selon qu'il s'agit d'un appel local ou d'un appel international. Les numéros de téléphone internationaux sont le plus souvent écrits selon la norme définie par le CCITT [3,4], et commencent par un +, suivi d'un code de pays, suivi d'un code de ville (aux États-Unis, cela correspond à ce qu'on appelle un `` indicatif régional''). Ces codes de pays et ces codes de ville sont de longueur variable, mais comme ils sont utilisés pour le routage des appels, ils sont sans préfixe et sans ambiguïté. Ainsi en identifiant un numéro au sein d'une page, nous sommes en mesure de déterminer le pays et la ville du numéro sans difficulté.

Une complication supplémentaire pour les appels internationaux provient du fait que dans certains pays, vous devez composer un code d'accès international (appelé code de numérotation directe internationale ou IDD) pour passer un appel international (par exemple, aux États-Unis, c'est 011). Ceci est généralement ajouté au numéro international, et certaines personnes l'écriront même si cela ne fait pas partie de la norme. Nous avons également rencontré des pages contenant des instructions de numérotation téléphonique à partir des systèmes Centrex, où vous devez composer un code d'accès externe (par exemple, un 9 ou un 8) avant de composer le numéro complet.

La plupart du trafic téléphonique est local plutôt qu'international et, par conséquent, de nombreux numéros sont écrits selon les coutumes locales plutôt que selon une norme internationale. À moins qu'un contexte géographique ne puisse être déduit d'une autre source pour développer le numéro dans sa forme internationale, la construction du numéro international complet sera impossible à construire. Pour distinguer un numéro local d'un numéro international, nous avons quelques conseils pour nous aider. Dans certains pays, vous devez composer un indicatif national de numérotation directe (NDD) afin de passer un appel d'une ville à une autre ville toujours dans le même pays. Dans ce cas, le code du pays est omis et un numéro d'accès local est parfois ajouté au début, de sorte que la forme locale n'est pas nécessairement un suffixe du numéro international. Ainsi, un numéro international du Royaume-Uni qui serait normalement écrit comme +44 12 345 6789 pourrait être écrit comme (0)12 345 6789 lorsqu'il est référencé à l'intérieur du Royaume-Uni. Si l'appel provient de ce numéro depuis la même ville, il vous suffira de composer le 12 345 6789. Afin de représenter à la fois les formulaires internationaux et intranationaux, certaines personnes ont adopté un formulaire comme le +44 (0)12 345 6789. Une complication supplémentaire résulte de l'utilisation non standard de parenthèses, d'espaces, de barres obliques et de tirets dans le nombre. Toutes ces règles ont été incorporées dans un analyseur flex.

En plus de reconnaître un code de pays et de ville pour un numéro de téléphone, il est possible de déduire des détails encore plus fins dans certains cas. Aux États-Unis, les numéros de téléphone sont segmentés par un « indicatif régional » à 3 chiffres (également appelé zone de plan de numéros ou NPA), et des blocs de 10 000 numéros (appelés central ou NXX) au sein d'un NPA sont ensuite attribués à des opérateurs individuels. Cette affectation relève du contrôle du plan de numérotage nord-américain (NANP). Les échanges individuels (combinaisons NPA/NXX) sont généralement confinés à une région géographique assez petite, et sont donc une bonne source de contexte géographique. Nous avons téléchargé une base de données sur Internet [8] qui fournit la latitude et la longitude pour plus de 100 000 préfixes téléphoniques NPA/NXX aux États-Unis. Une base de données faisant plus autorité est disponible sous licence et abonnement auprès de la Traffic Routing Administration [20]. Leur base de données fournit des coordonnées verticales et horizontales (V&H) dans un système de coordonnées unique qui est utilisé pour calculer les taux de facturation entre les différents échanges (voir http://www.trainfo.com/products_services/tra/vhpage.html). Avec un petit effort, la conversion des coordonnées V&H en latitude et longitude est possible.

Le Canada et les Caraïbes sont inclus dans le NANP, mais la base de données de Dykstra n'inclut pas les Caraïbes, nous avons donc téléchargé une liste distincte sur areacode.com . Pour les numéros internationaux, nous avons utilisé la liste des codes de ville et de pays des archives Telecom [18]. Cette liste est quelque peu dépassée, mais nous a donné une liste d'environ 24 000 codes de ville et codes de pays. Nous avons ensuite tenté de comparer cette liste de villes avec la base de données NIMA (voir la section [16]) des noms de lieux géographiques, qui a renvoyé la latitude et la longitude de 16 500 des villes. De cette façon, nous avons pu construire une base de données rudimentaire pour prouver le concept de recherche de numéros de téléphone, bien qu'une couverture clairement plus complète soit possible avec plus d'efforts et des données plus fiables.

En descendant au niveau des numéros individuels, il existe des bases de données qui fournissent une adresse physique pour la plupart des numéros de téléphone. De telles bases de données sont généralement propriétaires et coûteuses en raison de leur valeur commerciale et du niveau de maintenance requis pour les maintenir à jour. En combinant de telles bases de données avec d'autres telles que l'ensemble de données Tiger, il est possible de déterminer le contexte géographique à partir des numéros de téléphone avec une assez grande précision. Pour les numéros de téléphone non américains, de telles bases de données sont probablement également disponibles, même si les trouver pour des juridictions individuelles serait fastidieux.

   3. Noms d'entités géographiques

Le deuxième ensemble de données que nous avons trouvé est le système de noms géographiques de la base de données de la National Imagery and Mapping Agency des États-Unis (NIMA, anciennement Defense Mapping Agency) des noms d'entités géographiques internationales. Cela comprend une base de données d'emplacements pour environ 3,5 millions d'entités dans le monde dont les noms sont approuvés par le U.S. Board on Geographic Names. Le but de cette base de données est de normaliser l'orthographe des noms de lieux dans les publications du gouvernement américain, mais en conséquence, elle fournit une base de données très à jour et précise des noms de lieux géographiques et des emplacements. Chaque mois, environ 20 000 éléments sont mis à jour.

En combinant ces deux bases de données, nous avons une liste d'environ six millions de noms d'entités géographiques dans le monde ainsi que leur latitude et longitude. Reconnaître un si grand nombre de modèles dans une page Web nécessite une petite attention aux algorithmes et aux logiciels, car il est inacceptable d'effectuer une vérification distincte pour chaque modèle. Pour les petites listes de phrases, flex fournit un mécanisme pour reconnaître de tels modèles à l'aide d'une machine à états finis. À cette échelle cependant, le flex est inapproprié. Une autre approche consiste à utiliser fgrep, qui utilise l'algorithme Aho-Corasick [1]. L'algorithme Aho-Corasick est parfaitement adapté à cette application. Si la longueur combinée des motifs est M , alors une fois qu'un précalcul du temps M a été effectué, le temps pour reconnaître ces motifs est O ( n ), où n est la longueur du document à rechercher.

Lorsque le nom ``Chicago'' apparaît dans une page Web, nous pouvons naturellement supposer que la page Web a quelque chose à voir avec la ville de l'Illinois et attribuer un contexte géographique. Une telle affectation va clairement être associée à quelques erreurs, cependant, puisque le mot « Chicago » a plusieurs significations, y compris le nom d'une ville aux États-Unis, un groupe de musique pop et le nom du projet interne utilisé pour Microsoft Windows'95 lors de son développement. Ainsi, lorsque nous reconnaissons le mot ``Chicago'', il n'est pas toujours correct de supposer un contexte géographique, et nous devrions probablement utiliser la corroboration d'un autre facteur avant de faire cette association. Même s'il s'agissait d'une affectation géographique appropriée, il est intéressant de noter que le mot « Chicago » apparaît dans le nom de plus de 243 entités en dehors de l'État de l'Illinois, réparties dans 27 États américains. Il ne fait aucun doute que beaucoup d'entre eux sont obscurs, mais cela illustre le danger d'utiliser des mots courants comme indicateurs du contexte géographique.

Dans un récent projet Internet [6], 1 il a été proposé que les auteurs utilisent une simple balise META pour coder les informations de position. Les balises proposées permettent de spécifier une latitude, une longitude, une altitude, une région (par exemple, un code de pays ISO) et un nom de lieu. L'existence d'une telle balise offre un certain avantage, car l'auteur est susceptible de mieux comprendre le contexte géospatial correct pour le contenu. Malheureusement, la proposition pose de nombreux problèmes. D'une part, les auteurs ont rarement les bons outils pour déterminer les coordonnées précises de leur contenu. En outre, il n'y a pas de normes ou de registres internationaux pour la terminologie commune sur les noms de lieux (par exemple, en identifiant Florence et Firenze comme le même endroit). La proposition ne répond pas non plus à plusieurs autres besoins, notamment les emplacements mobiles et la capacité d'encoder des limites polygonales (par exemple, pour une rivière ou un comté). De plus, toutes les initiatives de métadonnées souffrent du problème de la poule et de l'œuf de souhaiter que le Web existant soit modernisé avec des métadonnées. Nous pensons que notre travail démontre qu'il est déjà possible de construire des métadonnées géospatiales assez fiables directement à partir du contenu sans avoir besoin de réécrire le Web, même s'il serait clairement préférable que les auteurs créent des documents d'une manière qui corresponde à leur contexte géographique. explicite et facilement analysable.

A noter qu'un service expérimental pour un tel géocodage est disponible en ligne. Ils offrent également un moteur de recherche rudimentaire avec la possibilité de restreindre la recherche par limites spatiales, mais ils n'indexent que les pages qui contiennent la balise META spécifiée. Le nombre de pages contenant ces balises est actuellement très faible.

Il existe plusieurs autres efforts pour spécifier des formats de données pour les métadonnées géospatiales. L'un est contenu dans la balise Dublin Core [22] ``Coverage'', qui comprend une balise XML qui spécifie soit une converage temporelle, un emplacement spatial ou une juridiction pour la ressource. L'emplacement spatial peut ensuite être spécifié sous forme de nom de lieu, de point, de région polygonale ou de géocode unique au monde (comme un code postal à neuf chiffres aux États-Unis). La recommandation reconnaît la nécessité d'un vocabulaire contrôlé pour les noms de lieux, et donne l'exemple du Getty Thesaurus of Geographic Names [10]. Il décrit également des manières d'encoder des régions polygonales dans un système de coordonnées. Une autre tentative de définition des métadonnées géographiques a été développée par le Federal Geographic Data Committee des États-Unis. Ils se concentrent presque entièrement sur l'encodage des ensembles de données géographiques, et peu d'attention est portée au formatage des métadonnées qui permettrait une analyse et une découverte de ressources faciles dans les pages Web.

L'interopérabilité et l'échange de données entre les systèmes SIG se sont toujours avérés difficiles, et il existe peu de normes pour aider dans ce domaine. L'Open GIS Consortium promeut l'interopérabilité et les normes de format et d'échange de données. Ils ont proposé un mécanisme assez élaboré pour l'encodage de l'information géographique via le langage de balisage géographique (GML). Leur proposition utilise XML pour coder les noms de lieux géographiques et les informations géométriques pour les entités géographiques. En raison de la nature très technique du format, l'auteur estime qu'il est mal adapté à une collection de documents aussi diversifiée que le web.

Dans notre système prototype, nous avons fait plusieurs choix qui simplifient grandement la conception de la base de données. L'une d'entre elles consistait à nous limiter à une liste relativement restreinte d'emplacements (environ 150 000). En regroupant tous les contextes géographiques à ce petit nombre d'emplacements réels, nous sommes en mesure de réduire considérablement la complexité de la base de données. Another choice we made was to use simple hashtable lookups, and build query logic on top of this. Thus we designed the database using only two lists. The first list stores the location IDs associated with a given URL. The second list stores the URLs associated with a given location ID. On top of this we built software to support range queries and k nearest neighbor searches.


Over the past year, the GIS division of the Information Technology department received two awards related to their contributions to disaster response/recovering during and in the aftermath of the 2015 flooding event.

Richland County Emergency Services Director’s Award

This award was given, ‘In recognition of dedication and outstanding contributions to Richland County emergency management during the millennium flood event October 2015’

J. Mitchell Graham Award – 2016 Honorable Mention

Each year the South Carolina Association of Counties (SCAC) grants the J. Mitchell Graham Award to counties that demonstrate innovation in projects that are designed and implemented to meet community needs. Richland County IT/GIS was recognized for the development and publication of geospatial resources to assist with 2015 flood disaster response/recovery.

Application materials and presentation can be found here:


Buy the bundle and save.
Add Snagit,
the #1 Camtasia Companion.

You can import the following file formats into Camtasia for editing:

MP4 (AVC/h.264 codecs required, 30 frames per second or less)

MTS and M2TS files (version 8.4 and later). The AC-3 Filter is required if you are running Windows 8 or Windows 7. For more information, see this article.

MOV H.264 and PNG MOV codecs are supported. For more information, see this article.

Microsoft Windows 10 (64-bit) 1709 "Creators Update" version or later. (Recommended: Microsoft Windows 10 (64-bit) "May 2020 Update" version or later.)

6th Generation Intel® Core™ i3 Processor or 1st Generation AMD® Ryzen™ 3 Processor (Recommended: 3.5 10th Generation Intel® Core™ i5 Processor or better or 2nd Generation AMD® Ryzen™ 5 Processor or better)

  • 8 GB RAM (Recommended: 16 GB or more)
  • NVIDIA GeForce 10 Series or higher (Recommended)
  • 4 GB of hard-disk space for program installation (Recommended: SSD with 4GB of available disk space)
  • Display dimensions of 1366x768 or greater (Recommended: 1920x1080 or greater)
  • Microphone: Internal microphone (Recommended: USB or other external microphone for voice recording)
  • Internet connection and a TechSmith account are required for the trial and some additional connected features
  • Microsoft .NET 4.7.2 or later (included), WebView2 Runtime (included), Windows N requires the MediaFeature pack for Windows N

macOS 10.14 (Recommended: macOS 11 or later)

6th-Generation Intel® Core™ i5 Processor with 64-bit support (Recommended: 10th-Generation Intel® Core™ i5 Processor with 64-bit support or M1 Apple Silicon processor)

  • 8GB of RAM (Recommended: 16GB of RAM or greater)
  • 4GB of available disk space minimum (Recommended: SSD with 4GB of available disk space)
  • Microphone: Internal microphone (Recommended: USB or other external microphone for voice recording)
  • Internet connection and a TechSmith account are required for the trial and some additional connected features
  • PowerPoint Import requires Powerpoint 2016, 2019 or later for Mac, Playback using the Smart Player is supported on Internet Explorer 11+, Microsoft Edge, Chrome, Firefox, and Safari, iOS 11 or later, Android 5 or later

You can install your license on up to two computers for a single user. For example, you can install on a desktop and a laptop or at home and at work.

If your computer crashes or you get a new machine, you can reinstall the version that you purchased, as long as you don’t have the program installed on more than two computers at a time.

Volume discounts are available starting at 5 licenses or more. The more licenses you buy, the lower the price. Learn More.