Suite

Comment mesurer la distance entre deux points dans un arcmap de pays


J'ai deux fichiers de formes avec des points répartis dans le monde entier. Je voudrais mesurer la distance (comme à vol d'oiseau en km) de chaque point du shapefile 1 au point le plus proche du shapefile 2, ajouter tous les attributs du point le plus proche du shapefile2 au point du shapefile1 mais en même temps je doivent s'assurer que ces distances ne sont calculées qu'à l'intérieur d'un même pays. La mesure de distance ne doit traverser aucune frontière.

J'ai essayé d'utiliser l'option Près et cela me donne en partie ce que je veux. Il ajoute tous les attributs du point le plus proche dans shapefile2 au point le plus proche dans shapefile1 et mesure la distance. Maintenant, le seul problème est qu'il ne prend pas en compte si les deux points les plus proches sont également dans le même pays. J'aurais besoin de quelque chose comme une option "si" pour l'outil Près. Quelque chose comme "mesurer la distance au point le plus proche si le pays dans le fichier de formes 1 = pays dans le fichier de formes 2". Y a-t-il quelque chose comme ça ??

Aucune suggestion?


C'est plus ou moins une réécriture complète de ma réponse originale; J'avais tort sur ce que je pensais que le PO demandait. Compte tenu de certaines des informations supplémentaires, je recommanderais de faire quelque chose comme ce qui suit. Vous pouvez l'entrer dans la console python ou simplement créer un script autonome sur le bureau et l'exécuter en veille.

import arcpy arcpy.env.overwrite = True country = r"chemin/vers/pays.shp" pointsA = r"chemin/vers/pointsA.shp" pointsB = r"chemin/vers/pointsB.shp" ## créer des couches d'entités pour ces ensembles de données coun = arcpy.management.MakeFeatureLayer(countries,"coun_fl") ptA = arcpy.management.MakeFeatureLayer(pointsA,"ptA_fl") ptB = arcpy.management.MakeFeatureLayer(pointsB,"ptB_fl") ## obtenir les FID de pays qui croisent réellement ces points arcpy.management.SelectLayerByLocation(coun,"NEW_SELECTION",ptA) arcpy.management.SelectLayerByLocation(coun,"ADD_TO_SELECTION",ptB) fids = [r[0] pour r dans arcpy.da.SearchCursor (coun,"FID")] ## parcourez la liste FID, sélectionnez chaque pays, puis sélectionnez les points pour fid dans fids : sql = '"FID" = {0}'.format(fid) arcpy.management.SelectLayerByAttribute( coun,"NEW_SELECTION",sql) arcpy.management.SelectLayerByLocation(ptA,"NEW_SELECTION",coun) arcpy.management.SelectLayerByLocation(ptB,"NEW_SELECTION",coun) ## maintenant vous n'avez sélectionné que les points qui tombent dans le même country ## vous pouvez faire l'opération que vous voulez, comme arcpy.analysis.Near(ptA,ptB)

Je ne sais pas combien de points vous traitez, donc je ne sais pas si c'est le moyen le plus rapide d'accomplir ce dont vous avez besoin. Les processus sélectionnés peuvent parfois être sloooowww.

Vous aurez toujours besoin de vérifier les systèmes de coordonnées projetés que vous utilisez.


La distance la plus courte entre deux points sur une sphère [dupliquer]

Si à la fois $P_1$ et $P_2$ se trouvent sur la sphère $(x-x_0)^2+(y-x_0)^2+(z-z_0)^2=r^2$ , alors quelle est la longueur du chemin le plus court entre les deux points tel que le chemin se trouve sur la surface de la sphère ?

La formule de distance écrite ci-dessus ne fonctionnera pas pour résoudre ce problème.

Comment exprimer la longueur du plus court chemin qui se trouve sur la sphère en termes de $x_0,y_0,z_0,x_1,y_1,z_1,x_2,y_2,z_2,$ et $r$ ?

Je pense que la longueur de l'arc en utilisant l'intégration est la bonne façon, mais j'ai du mal avec elle. Toute aide serait appréciée.


Utilisez une approximation de la terre et la formule Haversine. Vous pouvez obtenir une version javascript sur l'url suivante, que vous pouvez traduire dans la langue de votre choix :

Cela le fera pour vous en c#.

Dans l'espace de noms, mettez ceux-ci :

Ensuite, pour les utiliser dans le code principal :

  • tu sais que les 2 points sont "pas trop loin les uns des autres"
  • et vous tolérez un "raisonnablement petit" Erreur.

Considérons alors que la terre est plate entre les 2 points :

  • La différence de distance dans la direction de la latitude est EarthRadius * différence de latitude
  • La différence de distance dans la direction de la longitude est EarthRadius * différence de longitude * cos (latitude) . On multiplie par cos(lat) car les degrés de longitude ne font pas la même distance en km si la latitude change. Comme P1 et P2 sont proches, cos(latP1) est proche de cos(latP2)
  • puis Pythagore

Je l'ai testé entre Paris et Orléans (France) : la formule trouve 110,9 km alors que la formule (exacte) Haversine trouve 111,0 km.

. Attention aux situations autour du méridien 0 (vous pouvez le décaler) : si P1 est à Lng 359 et P2 est à Lng 0, la fonction les considérera anormalement loin .

Le théorème de Pythagore tel qu'il est proposé par d'autres ici ne fonctionne pas si bien.

La meilleure réponse simple consiste à approximer la Terre comme une sphère (c'est en fait une sphère légèrement aplatie, mais c'est très proche). Dans Haskell, par exemple, vous pouvez utiliser ce qui suit, mais les mathématiques peuvent être transcrites dans à peu près n'importe quoi :

distRadians exige que vos angles soient donnés en radians.

distDegrees est une fonction d'assistance qui peut prendre des latitudes et des longitudes en degrés.

Voir cette série de messages pour plus d'informations sur la dérivation de cette formule.

Si tu vraiment besoin de la précision supplémentaire accordée en supposant que la terre est ellipsoïdale, voir cette FAQ : http://www.movable-type.co.uk/scripts/gis-faq-5.1.html

Voici un moyen de le faire si vous utilisez un serveur SQL.

Vous cherchez la longueur du chemin du Grand Cercle entre deux points sur une sphère. Essayez de rechercher "Great Circle Path" ou "Great Circle Distance" sur Google.

Désolé, je ne sais même pas dans quel pays tu es. Parlons-nous d'Easting and Northings (Royaume-Uni, système Ordance Survey) ou Lat/Long ou d'un autre système ? Si nous parlons de l'Est et du Nord, vous pouvez utiliser
sqr((x1-x2)^2 + (y1-y2)^2)
Cela ne tient pas compte du fait que la terre est une sphère, mais pour de courtes distances, vous ne le remarquerez pas. Nous l'utilisons au travail pour les distances entre les points dans le comté.
Faites attention à la longueur de référence de grille que vous utilisez. Je pense qu'une référence à 8 chiffres vous donnera une distance en mètres. Je serai en mesure d'obtenir une réponse précise au travail la semaine prochaine si personne d'autre ne l'a fournie.


Présentation de la méthode

Renvoie un tuple d'angle et de distance à un autre point à l'aide d'un type de mesure.

Construit la limite de la géométrie.

Construit un polygone à une distance spécifiée de la géométrie.

Construit l'intersection de la géométrie et de l'étendue spécifiée.

Indique si la géométrie de base contient la géométrie de comparaison.

contient est l'opposé de à l'intérieur.

Seules les relations vraies sont affichées dans cette illustration.

Construit la géométrie qui est le polygone de délimitation minimal de telle sorte que tous les angles extérieurs soient convexes.

Indique si les deux géométries se coupent dans une géométrie d'un type de forme inférieur.

Deux polylignes se croisent si elles ne partagent que des points en commun, dont au moins un n'est pas une extrémité. Une polyligne et un polygone se croisent s'ils partagent une polyligne ou un point (pour une ligne verticale) en commun à l'intérieur du polygone qui n'est pas équivalent à la polyligne entière.

Seules les relations vraies sont affichées dans cette illustration.

Divise cette géométrie en une partie à gauche de la polyligne de coupe et une partie à droite de celle-ci.

Lorsqu'une polyligne ou un polygone est coupé, il est divisé à l'endroit où il coupe la polyligne de coupe. Chaque pièce est classée à gauche ou à droite de la fraise. Cette classification est basée sur l'orientation de la ligne de coupe. Les parties de la polyligne cible qui n'intersectent pas la polyligne de coupe sont renvoyées comme faisant partie du droit de résultat pour cette polyligne en entrée. Si une géométrie n'est pas coupée, la géométrie de gauche sera vide ( Aucun ).

Crée une nouvelle géométrie avec des sommets ajoutés.

Construit la géométrie composée uniquement de la région unique de la géométrie de base mais ne faisant pas partie de l'autre géométrie. L'illustration suivante montre les résultats lorsque le polygone rouge est la géométrie source.

Indique si les géométries de base et de comparaison ne partagent aucun point commun.

Deux géométries se coupent si disjoint renvoie False .

Seules les relations vraies sont affichées dans cette illustration.

Renvoie la distance minimale entre deux géométries. Si les géométries se coupent, la distance minimale est 0.

Les deux géométries doivent avoir la même projection.

Indique si les géométries de base et de comparaison sont du même type de forme et définissent le même ensemble de points dans le plan. Il s'agit d'une comparaison 2D, seules les valeurs M et Z sont ignorées.

Seules les relations vraies sont affichées dans cette illustration.

Crée une nouvelle géométrie simplifiée à l'aide d'une tolérance de décalage maximale spécifiée.

Renvoie la zone de l'entité à l'aide d'un type de mesure.

Renvoie la longueur de l'entité à l'aide d'un type de mesure.

Renvoie un tableau d'objets ponctuels pour une partie particulière de la géométrie ou un tableau contenant un certain nombre de tableaux, un pour chaque partie.

Construit une géométrie qui est l'intersection géométrique des deux géométries en entrée. Différentes valeurs de dimension peuvent être utilisées pour créer différents types de formes.

L'intersection de deux géométries du même type de forme est une géométrie contenant uniquement les régions de chevauchement entre les géométries d'origine.

Pour des résultats plus rapides, testez si les deux géométries sont disjointes avant d'appeler intersect .

Renvoie une mesure du point de départ de cette ligne au in_point .

Indique si l'intersection des deux géométries a le même type de forme que l'une des géométries en entrée et n'est équivalente à aucune des géométries en entrée.

Seules les relations vraies sont affichées dans cette illustration.

Renvoie un point à un angle et une distance donnés en degrés et en mètres à l'aide du type de mesure spécifié.

Renvoie un point sur une ligne à une distance spécifiée du début de la ligne.

Projette une géométrie et applique éventuellement une géotransformation.

Pour projeter, la géométrie doit avoir une référence spatiale et non un UnknownCoordinateSystem . Le nouveau système de référence spatiale passé à la méthode définit le système de coordonnées de sortie. Si l'une des références spatiales est inconnue, les coordonnées ne seront pas modifiées. Les valeurs Z et de mesure ne sont pas modifiées par la méthode ProjectAs.

Recherche le point sur la polyligne le plus proche du point in_point et la distance entre ces points. Renvoie également des informations sur le côté de la ligne sur lequel se trouve in_point ainsi que la distance le long de la ligne où se trouve le point le plus proche.

Renvoie une polyligne entre les mesures de début et de fin. Similaire à Polyline.positionAlongLine mais renverra un segment de polyligne entre deux points sur la polyligne au lieu d'un seul point.

Renvoie un nouveau point basé sur in_point accroché à cette géométrie.

Construit la géométrie qui est l'union de deux géométries moins l'intersection de ces géométries.

Les deux géométries d'entrée doivent être du même type de forme.

Indique si les limites des géométries se coupent.

Deux géométries se touchent lorsque l'intersection des géométries n'est pas vide, mais que l'intersection de leurs intérieurs est vide. Par exemple, un point touche une polyligne uniquement si le point coïncide avec l'un des points d'extrémité de la polyligne.

Seules les relations vraies sont affichées dans cette illustration.

Construit la géométrie qui est l'union théorique des ensembles des géométries d'entrée.

Les deux géométries réunies doivent être du même type de forme.

Indique si la géométrie de base se trouve dans la géométrie de comparaison.

dans est l'opérateur opposé de contient .

Seules les relations vraies sont affichées dans cette illustration.


Utiliser les circuits comme mesure d'efficacité du réseau : l'exemple de Paris

Circuity, également appelé indice de détour ou facteur de route, est le rapport de la distance du réseau entre deux points à la distance euclidienne ou «à vol d'oiseau». Cette étude vise à présenter une procédure simple mais efficace pour évaluer l'efficacité du réseau de transport dans et entre les différentes parties d'une zone urbaine à l'aide de partitionnement de circuits et de concentration. A titre d'exemple, le réseau routier de la ville de Paris et de ses environs est examiné à l'aide des données du réseau planaire d'OpenStreetMap. La variation des niveaux de circuits est analysée en quantifiant la structure physique du réseau routier grâce à l'utilisation d'indices topologiques basés sur la théorie des graphes. Les résultats révèlent que l'indice bêta, ou le nombre moyen de tronçons par nœud, et l'ordre d'un nœud, ou le nombre de tronçons se connectant à un nœud, jouent un rôle plus important dans la création d'itinéraires plus directs avec moins de circuits sur une route. réseau. Il est conclu que les priorités de la planification urbaine affectent l'efficacité des transports et l'efficacité du réseau peut être évaluée par une procédure simple mais efficace basée sur des circuits pour guider l'élaboration des politiques.


Propriétés

Renvoie une représentation Esri JSON de la géométrie sous forme de chaîne.

Astuce :

La chaîne renvoyée peut être convertie en dictionnaire à l'aide de la fonction Python json.loads.

Renvoie la représentation binaire bien connue (WKB) pour la géométrie OGC. Il fournit une représentation portable d'une valeur géométrique sous la forme d'un flux contigu d'octets.

Renvoie la représentation textuelle connue (WKT) pour la géométrie OGC. Il fournit une représentation portable d'une valeur géométrique sous forme de chaîne de texte.

L'aire d'une entité surfacique. Vide pour tous les autres types d'entités.

Le véritable centroïde s'il se trouve dans ou sur l'entité, sinon, le point d'étiquette est renvoyé. Renvoie un objet point.

L'étendue de la géométrie.

Le premier point de coordonnées de la géométrie.

Une chaîne délimitée par des espaces des paires de coordonnées du rectangle à enveloppe convexe.

True , si le nombre de pièces pour cette géométrie est supérieur à un.

Le point où se trouve l'étiquette. Le labelPoint est toujours situé dans ou sur une entité.

La dernière coordonnée de l'entité.

La longueur de l'entité linéaire. Zéro pour les types d'entités point et multipoint.

La longueur 3D de l'entité linéaire. Zéro pour les types d'entités point et multipoint.

Le nombre de pièces géométriques pour la fonction.

Le nombre total de points pour l'entité.

La référence spatiale de la géométrie.

Le centre de gravité d'une entité.

Le type de géométrie : polygone, polyligne, point, multipoint, multipatch, cote ou annotation.


4 réponses 4

Voici un exemple de code Python qui résout le problème d'optimisation suggéré par @DeepSea

En supposant que vous parlez de la distance perpendiculaire d'un point sur le cercle le plus proche de la ligne donnée.

l'équation de la droite $P_1P_2$ est $(y-y_1)=dfrac(x-x_1)$

Les formules pour la distance seront $perp$ distance du centre du cercle à la ligne - rayon du cercle. parce que le point le plus proche sur n'importe quelle courbe d'une ligne se trouve sur la normale commune aux deux et la normale commune dans ce cas est le $perp$ du centre à la ligne.

Ce que vous voulez, c'est la distance entre le centre du cercle et la ligne, moins le rayon.

Vous devez commencer à dériver l'équation de votre droite sous la forme $ax+by=c$. Remplacez $left(x,y ight)$ par (x1,y1) , puis par (x2,y2) pour trouver les valeurs de $a,b,c$. Vous devrez les choisir de manière à ce que $a^2+b^2=1$ (ou choisir comme bon vous semble, puis diviser toute l'équation par $a^2+b^2$). Vous avez les trois équations suivantes pour déterminer $a,b,c$ : $ax_1+by_1=c$ $ax_2+by_2=c$ $a^2+b^2=1$ Cela aura deux solutions : une $ left(a,b,c ight)$ et un $left(-a,-b,-c ight)$. Vous pouvez choisir l'un ou l'autre. Un moyen simple est de toujours utiliser $c>0$.

Maintenant, la distance d'un point aléatoire $left(x,y ight)$ à la ligne sera juste $ax+by-c$.

ÉDITER: En fait, la valeur $ax+by-c$ sera positive si le point $left(x,y ight)$ est d'un côté de la ligne, et négative s'il est de l'autre côté. La distance est, bien sûr, sa valeur absolue.

Soit dit en passant, le point $left(a,b ight)$ représente le vecteur perpendiculaire à la ligne, et $c$ est la distance entre l'origine du système de coordonnées et la ligne.

EDIT 2: Au début, je pensais que vous vouliez la distance à la ligne, mais il a été souligné dans le commentaire ci-dessous que vous voulez la distance à la ligne segment. Eh bien, une façon est d'observer le point $left(x-ta,y-tb ight)$, où $t=ax+by-c$. Ce point est la projection de $left(x,y ight)$ sur la ligne. Si ce point est à l'intérieur du segment, alors la distance à la ligne est la même que la distance au segment. Si ce point est ne pas à l'intérieur du segment, la distance jusqu'au segment est simplement la distance jusqu'à l'extrémité la plus proche.

Pour que le point $left(x-ta,y-tb ight)$ soit à l'intérieur du segment, sa distance à chaque extrémité doit être inférieure ou égale à la longueur du segment.


Hfrhyu

Quel était le dernier processeur x86 qui n'avait pas d'unité à virgule flottante x87 intégrée ?

Les araignées sont-elles incapables de blesser les humains, en particulier les très petites araignées ?

Un empire pourrait-il contrôler la planète entière avec les méthodes de communication d'aujourd'hui ?

ELI5 : Pourquoi disent-ils qu'Israël aurait été le quatrième pays à poser un vaisseau spatial sur la Lune et pourquoi l'appellent-ils low cost ?

Accepté par l'université européenne, rejeté par toutes les universités américaines auxquelles j'ai postulé ? Raisons possibles?

Travailler sur le principe de responsabilité unique (SRP) en Python lorsque les appels sont coûteux

Ellipses imbriquées dans tikzpicture : hiérarchie de Chomsky

Résoudre un système surdéterminé par décomposition QR

Est-il éthique de télécharger un article généré automatiquement sur un site non évalué par des pairs dans le cadre d'une recherche plus large ?

Pourquoi les périphériques sur différents VLAN, mais sur le même sous-réseau, ne peuvent-ils pas communiquer ?

L'opération "is" renvoie false même si deux objets ont le même identifiant

Pourquoi le shell ne corrige-t-il pas automatiquement « l'utilisation inutile de cat » ?

Comment répondre poliment aux e-mails génériques demandant un doctorat/un emploi dans mon laboratoire ? Sans perdre trop de temps

Pourquoi un levier hydraulique ne viole-t-il pas la conservation de l'énergie ?

Est-ce que chaque épisode de "Où sont mes pantalons?" identique?

Existe-t-il un moyen de générer des points uniformément répartis sur une sphère à partir d'un nombre fixe de nombres réels aléatoires par point ?

Le MD peut-il remplacer les traits raciaux ?

Comment la mesure LRS ArcGIS le long d'une ligne est-elle mise en œuvre ?

Annonce de l'arrivée de Valued Associate # 679: Cesar ManaraEcriture de la longueur de la ligne le long de la ligneDistance à la sortie du hub le plus proche non correcte capable d'utiliser des unitésComment interpoler un point lat/long entre deux autres à une distance donnéeLe plugin LRS ne renvoie pas de champ de mesure.Calculer la distance aux points le long de la ligne dans ArcMap ?Pourquoi l'emplacement de ma ligne au-dessus d'un fond de carte diffère-t-il entre ArcGIS Pro et ArcMap malgré l'application du même système de coordonnées projetées ?

J'essaie de reproduire un cas de coin désagréable dans une implémentation LRS qui n'est pas d'accord avec l'outil de mesure ArcMAP. J'ai essayé de mesurer la distance dans son système de coordonnées shp natif NAD83 (27916) en vain. (essentiellement les mêmes résultats)

Ma question est de savoir comment sont calculées les distances le long d'une ligne pour le système LRS. Ma fonction de distance actuelle (pour 4326) est la suivante.

Pour la plupart des géométries, la distance entre le LRS ESRI et le mien est nominale mais celle-ci est différente. J'ai déjà eu affaire à des chaînes de lignes plus grandes (plus de 30 milles) sans aucun problème. Auparavant, ces autres chaînes de lignes plus grandes fonctionnaient bien tout au long de l'alignement, mais avec ce cas de bord, je reçois

Différence de 0,5 miles (les distances de mon implémentation sont toujours plus grandes) entre les deux implémentations à la fin.

La distance est-elle calculée d'une manière différente via l'implémentation LRS, ma géométrie est-elle en train de dupliquer les points précédents ou est-il possible qu'une erreur du système de coordonnées se faufile réellement?

Pour la mesure de la vérité terrain, je suis en train de frapper un serveur principal ESRI LRS, je pense? Après avoir joué avec le code de cette carte Web. Fondamentalement, tout ce que je fais est d'itérer à travers les points de la chaîne de ligne objet, en ajoutant mon implémentation de distance à la distance le long de la ligne pour chaque point, puis en comparant les deux. J'ai modifié les paramètres de l'API pour la tolérance la plus basse car j'utilise la géométrie du point réellement constitutif et le système de coordonnées d'origine du shp. Pour être honnête, je n'ai aucune idée de la façon dont le LRS a été mis en œuvre, à part que les unités sont des miles.

Autres notes

J'ai essayé de déboguer cela pendant un certain temps hier, j'en suis venu à la conclusion que je ne pense pas que ce soit dans la formule de distance (bien que possible), plus un ensemble abstrait de points d'étalonnage par lequel le LRS d'ESRI est défini. La géométrie de la route représente un ensemble parallèle de vecteurs pour une bonne partie de celle-ci, et apparemment, certains systèmes LRS utilisent cette ligne centrale d'origine pour dériver le LRS.

En plus de cela, j'ai remarqué que les points sont des multiples très denses les uns sur les autres (sans jamais reculer cependant), je pense que la simplification sous-jacente peut également contribuer. De plus, cette géométrie est sur le point d'être modifiée massivement en raison de la construction d'une nouvelle chaussée, donc je pense qu'un petit changement par rapport à la fonctionnalité réelle n'a peut-être pas atteint la géométrie sur laquelle le LRS est basé pour cette chaussée. Cependant, je suis sûr d'avoir l'ensemble de données le plus à jour car il a été vidé juste pour déboguer les mêmes problèmes dans ArcDesktop.

La véritable confirmation de mes soupçons est lorsque j'ai déposé le shp brut dans Earth Pro avec le CRS d'origine et ouvert le profil d'élévation, et il avait le même point de repère que j'ai fait pour mon point de repère de débogage. J'ai donc l'impression d'avoir affaire à une géométrie simplifiée ou entièrement différente, ce qui est amusant.

Comme je l'ai dit, je peux me tromper complètement mais j'ai essayé toutes les formules de distance (géodésique, viscinité ?, normale, euclidienne) que je connais à la projection OG, et brut 4326 rien n'a fonctionné. J'espère que cela sera utile à quelqu'un d'autre et si je peux, je chercherai la documentation ESRI parlant de systèmes LRS abstraits à partir d'une ligne centrale, et posterai une image avec la sortie de la terre par rapport à la carte Web.


Comment construire un indice de distance

L'indice de distance culturelle (KSIndex) de Kogut et Singh (1988) est devenu une variable « indispensable » dans la recherche internationale en commerce et en gestion (Shenkar et al. 2008 : 908). Il calcule les différences culturelles nationales par la différence composite sur un ensemble de dimensions culturelles (voir Kogut & Singh, 1988 : 422) :

jeje désigne le pays d'accueil jle score moyen de Hofstede sur la ième dimension, jeDOMICILE au score moyen du pays d'origine sur cette même dimension, Vje à la variance de la jeème dimension et N au nombre de dimensions. L'indice de distance peut être calculé pour n'importe quelle construction multidimensionnelle. Comme nous le discutons en détail ci-dessous, les dimensions culturelles n'ont pas besoin d'être tirées de Hofstede mais peuvent également être dérivées des cadres culturels de Schwartz (1994, 1999, 2006) ou Globe (House et al., 2004). La formule de Kogut et Singh a été utilisée pour opérationnaliser d'autres types de distance en plus de la distance culturelle (par exemple, la distance réglementaire dans Wu & Salomon, 2016 distance institutionnelle dans Campbell, Eden & Miller, 2012).

L'indice de Kogut et Singh appartient à la famille des métriques de distance euclidienne. Kogut et Singh ont appliqué la métrique de distance euclidienne pour mesurer culturel national différences, mais il peut être appliqué à d'autres unités d'analyse (équipes, entreprises ou sous-unités). L'indice de Kogut et Singh représente une adaptation de la méthode euclidienne standard de calcul d'un indice de distance composite sur un ensemble de dimensions individuelles. La distance euclidienne entre un pays d'origine et un pays j sur un jeLa construction -dimensionnelle I est calculée comme suit 6 :

Prendre soin des différences de variance

La principale différence entre l'éq. 1 et Éq. 2 est la correction pour les variances différentes entre les dimensions, car un « problème avec la distance euclidienne est qu'elle ne prend pas en compte la variance des variables [individuelles] » (Berry et al., 2010 : 1469). C'est-à-dire que l'indice de Kogut et Singh est une distance euclidienne avec correction de la variance. De plus, Kogut et Singh ont divisé la distance globale par le nombre de dimensions, tandis que la formule de distance euclidienne prend la racine carrée de la différence globale.

L'indice de Kogut et Singh et l'indice de distance euclidienne sont souvent présentés comme des alternatives, et donc utilisés dans les tests de robustesse (par exemple, Barkema & Vermeulen, 1997 Drogendijk & Slangen, 2006). 7 Ci-dessous, nous illustrons la relation entre ces indices alternatifs pour deux des concepts de distance les plus utilisés : (1) la distance culturelle et (2) la distance institutionnelle.

Il existe trois cadres interculturels utilisés dans la littérature sur la gestion. Un résumé des principales caractéristiques de chacun, y compris leurs dimensions, se trouve à l'« Annexe A ». Le premier est le cadre culturel bien connu de Hofstede (1980, 2001). La première version comportait quatre dimensions culturelles, auxquelles deux autres ont été ajoutées par la suite (Hofstede et al., 2010). Alors que les quatre premières dimensions ont été dérivées d'enquêtes auprès d'employés d'IBM menées entre 1968 et 1972, les deux dernières sont basées sur un ensemble de six questions de la World Values ​​Survey–European Value Studies (WVS-EVS). 8 Berry et al. (2010) et Beugelsdijk, Maseland et & van Hoorn (2015) ont utilisé les données WVS-EVS pour développer des dimensions inspirées de Hofstede. 9 Schwartz (1994, 1999, 2006) a élaboré le Schwartz Value Survey, qui comprend sept orientations nationales sur les valeurs culturelles. Maison et al. (2004) ont développé neuf dimensions culturelles nationales pour les valeurs et les pratiques, un cadre communément appelé Globe.

Tous ces cadres culturels peuvent être utilisés pour calculer les distances culturelles entre les pays. Nous discutons ci-dessous si l'utilisation de la formule de Kogut-Singh ou de la formule de distance euclidienne donne des résultats radicalement différents. Nous calculons les deux indices pour toutes les paires de pays pour lesquelles des données sont disponibles. Le tableau 1 montre que les corrélations entre l'indice de Kogut et Singh (Eq. 1) et l'indice de distance euclidienne (Eq. 2) sont très élevées, allant de 0,89 (Globe) à 0,97 (les six dimensions de Hofstede). dix

Comme mentionné précédemment, des concepts de distance supplémentaires ont été développés pour compléter la distance culturelle, souvent mesurée en appliquant l'approche de Kogut et Singh. L'une d'entre elles est la distance institutionnelle (Eden & Miller, 2004 Malhotra & Gaur, 2014 Xie & Li, 2017 Xu & Shenkar, 2002), qui a été mesurée à l'aide de diverses bases de données, y compris la base de données Quality of Governance (QoG également appelée comme indicateurs de gouvernance mondiale) développés par la Banque mondiale (par exemple, Kaufmann, Kraay, & Mastruzzi, 2008 Abdi & Aulakh, 2012 Ang, Benischke, & Doh, 2015 Campbell et al., 2012 Hutzschenreuter et al., 2014 Li, Liu, Wright, & Filatotchev, 2014 Salomon & Wu, 2012), l'indice de liberté économique (EFI) fourni par la Heritage Foundation (par exemple, Demirbag, Apaydin, & Tatoglu, 2011 Gubbi, Aulakh, Ray, Sarkar, & Chittoor, 2010 He, Brouthers, & Filatotchev, 2013) et l'International Country Risk Guide (ICRG) développé par le groupe Political Risk Services (par exemple, Makino & Tsang, 2011 Valentino, Schmitt, Koch, & Nell, 2018).

Les données QoG se composent de six dimensions : l'état de droit, le contrôle de la corruption, l'efficacité du gouvernement, la voix et la responsabilité, la stabilité politique et la qualité de la réglementation. La Banque mondiale calcule des scores de pays standardisés pour ces six dimensions, il n'est donc pas nécessaire de redimensionner les dimensions en corrigeant les différences de variance. Cependant, la redimensionnement peut avoir une importance pour l'indice de distance basé sur l'EFI. L'EFI se compose de dix indicateurs de protection des droits de propriété, de niveaux de corruption, de liberté fiscale, de dépenses publiques et d'un ensemble de six indicateurs mesurant la liberté de faire des affaires, du commerce, de la finance et de l'investissement. Les scores EFI ne sont pas standardisés. Néanmoins, la corrélation entre les versions Kogut-Singh et euclidienne de cet indice est de 0,95 (voir tableau 1). L'ICRG comprend 12 dimensions liées au gouvernement et à la stabilité politique, aux niveaux de développement socio-économique, aux conflits et à la corruption, et aux tensions religieuses et ethniques. Comme le montre le tableau 1, l'indice de Kogut et Singh utilisant les dimensions ICRG correspond à 0,96 avec la version euclidienne.

La nécessité de redimensionner et de corriger les différences de variance entre les dimensions incluses dans un indice de distance dépend des données utilisées. Tant pour la distance culturelle qu'institutionnelle, la remise à l'échelle importe peu. Pour l'indice de distance institutionnelle basé sur la QoG, cela n'a aucune importance. Les fortes corrélations entre les indices de distance appliquant ou non une correction de la variance (Kogut-Singh vs. Euclidienne) ont des implications pour l'interprétation des résultats des études de distance. Compte tenu de ces corrélations élevées, nous ne nous attendrions pas à ce que les résultats diffèrent sensiblement entre les études utilisant ces deux méthodes (toutes choses étant égales par ailleurs).

Cependant, une précision importante doit être apportée. Il n'est pas toujours clair si les chercheurs utilisent la variance d'une dimension disponible pour toutes les données nationales, ou la variance au sein d'un ensemble de données composé uniquement d'un sous-échantillon de pays (par exemple, seuls les pays européens ou uniquement les dyades entre l'Allemagne et tout autre pays ). Pour le tableau 1, nous avons utilisé la variance basée sur tous les pays disponibles. Évidemment, le choix de la variance à utiliser peut avoir une influence significative sur l'indice de distance final. D'un point de vue théorique, nous pensons qu'il serait préférable de corriger la variance qui est considérée comme pertinente pour les entreprises considérées. Dans la plupart des cas, cependant, nous ne connaissons pas l'exposition pays réelle d'une entreprise (soit parce que nous ne connaissons pas le portefeuille de pays dans lesquels une entreprise a investi, soit parce que nous ne connaissons pas les pays que l'entreprise a éventuellement envisagés pour un décision de choix d'emplacement), et il peut donc être plus pratique d'utiliser la variance de toutes les données disponibles. Nous demandons instamment aux auteurs d'être transparents à cet égard.

Recommandation

Pour les distances culturelles et institutionnelles que nous avons calculées, le rééchelonnement n'a qu'un faible impact sur l'indice résultant. Pour ces indices, peu importe que l'on utilise l'indice de Kogut et Singh ou l'indice de distance euclidienne. Pourtant, cela pourrait être différent pour d'autres types de distance. Nous recommandons généralement que les chercheurs redimensionnent les dimensions individuelles de la distance - en particulier lorsqu'il existe des différences substantielles de variance entre les dimensions - et qu'ils soient transparents quant à la variance utilisée pour le faire.

Prendre soin de la covariance

En plus de la nécessité de corriger les différences de variance entre les dimensions, une deuxième préoccupation avec les approches euclidiennes est qu'elles ne tiennent pas compte des corrélations potentielles entre les dimensions de distance individuelles. Shenkar (2001) a souligné que les dimensions corrélées peuvent exercer une influence indue sur l'indice final. La méthode la plus fréquemment utilisée pour corriger la covariance entre les dimensions de distance est l'indice de Mahalanobis (Mahalanobis, 1937). La popularité de cette méthode a augmenté depuis que Berry et al. (2010) l'a introduit dans le domaine des affaires internationales.

L'approche de Mahalanobis prend en compte la matrice de variance-covariance complète lors du calcul de la distance entre les paires de pays. Comme Berry et al. (2010) note, la technique de Mahalanobis est particulièrement intéressante lorsque les dimensions incluses dans l'indice de distance sont mesurées sur une échelle différente (par exemple, le PIB par habitant et les taux d'inflation). Cet argument est moins pertinent pour la distance culturelle et institutionnelle car les deux sont couramment mesurés à l'aide de dimensions à échelle similaire (par exemple, les dimensions Hofstede et les dimensions EFI sont mesurées sur une échelle de 0 à 100, et les dimensions QoG sont standardisées).

La distance de Mahalanobis est souvent mal comprise, peut-être parce que la technique elle-même est relativement complexe. Souvent, la distance de Mahalanobis est perçue comme la technique la plus avancée ou la meilleure pour créer un indice composite (Flury & Riedwyl, 1986), mais ce n'est pas nécessairement vrai (Brereton & Lloyd, 2016). Lorsque les dimensions de distance individuelles incluses dans l'indice sont totalement décorrélées, l'indice de Mahalanobis résultant est parfaitement corrélé avec un indice euclidien corrigé de la variance (De Maesschalck, Jouan-Rimbaud, & Massart, 2000). Dans ce cas, l'application d'une technique de Mahalanobis et la correction de la covariance n'apportent aucune valeur ajoutée.

L'indice de Mahalanobis n'a pas non plus de valeur ajoutée lorsque toutes les dimensions sont très fortement corrélées entre elles (Brereton & Lloyd, 2016). Par exemple, les corrélations entre les six indicateurs QoG varient entre 0,62 et 0,94. 11 Une analyse factorielle en composantes principales sur ces six indicateurs montre qu'ils reflètent un seul construit expliquant 86 % de la variation entre les six indicateurs. Compte tenu de ces corrélations très élevées, il est logique d'utiliser le score factoriel et de mesurer la qualité institutionnelle comme un seul construit réflexif (par exemple, Lavie & Miller, 2008 Zaheer & Hernandez, 2011 Klopf & Nell, 2018).

Thus, Mahalanobis’ technique becomes relevant when there is a mix of high and low correlations between the indicators included. Under these circumstances, it may – albeit not necessarily – yield quite different results as compared to Euclidean approaches.

The six Hofstede dimensions, as well as the Schwartz and Globe dimensions, show such a mix of correlations (see “Appendix B”). While the QoG indicators are highly correlated, this does not hold for the 10 EFI dimensions (range between .01 and .92) and the 12 ICRG dimensions (range between .02 and .80) (see “Appendix C”). Table 2 compares the (variance-corrected) Euclidean distance index with the Mahalanobis distance index for cultural and institutional distance using alternative databases.

The Euclidean (four dimensional) Hofstede-based cultural distance correlates .88 with the Mahalanobis Hofstede-based cultural distance. For Hofstede’s six-dimensional model, this correlation is .84. Using alternative culture frameworks, we find that the correlation between the Euclidean distance and the Mahalanobis distance drops to .58 (Schwartz) and .72 (Globe). For the EFI-based institutional distance index, we find a correlation of .62, and for ICRG this correlation is .58.

Table 3 shows the correlations between QoG-based institutional distance constructs using Euclidean, Mahalanobis, and factor score techniques. The correlation between the Euclidean and Mahalanobis construct is only .40. The correlation between the Euclidean and the factor score using the first principal component of all six QoG indicators is .97.

The discussion on co-variance correction relates to the literature on index construction methods, and the distinction between formative and reflective constructs (Bollen & Diamantopoulos, 2017 Coltman, Devinney, Midgley & Venaik, 2008 Diamantopoulos, Riefler & Roth, 2008 Diamantopoulos & Winklhofer, 2001). Starting with the Kogut and Singh index (1988), cultural distance has been treated as a formative construct based on the four individual dimensions. The Mahalanobis approach continues this tradition as it essentially represents a formative approach to index construction. QoG, however, has been interpreted more as a reflective construct, whereby the latent institutional distance variable is reflected by all the individual dimensions (Lavie & Miller, 2008 Zaheer & Hernandez, 2011 Klopf & Nell, 2018 Slangen & Beugelsdijk, 2010).

We do not argue here that correcting for co-variance by using Mahalanobis’ approach is wrong. However, researchers should be aware that it represents a formative approach based on a given number of dimensions. It is debatable whether cultural distance and other distance constructs are theoretically of a formative nature or a reflective nature, or whether there is a more complex factor structure where both formative and reflective aspects are present. We think that highly aggregated constructs, such as distance constructs, often possess characteristics of reflective as well as formative constructs, a common phenomenon in the field of index construction (Bollen & Diamantopoulos, 2017), but which has been neglected in most distance research. In fact, the six cultural dimensions developed by Hofstede are already based on a factor analytic procedure, using the original survey questions based on a reflective logic. The Hofstede-based Mahalanobis distance index thus already represents a complex factor structure with formative and reflective elements.

The relatively high correlations between the Hofstede indices, whether or not applying co-variance correction, have implications for the interpretation of results of distance studies. Given these high correlations, we would not expect results to differ substantially between studies using these two methods (all else equal). In fact, meta-analysis of cultural distance and its relation to firm performance shows that there is no significant difference between the results obtained with the Hofstede-based Kogut and Singh index or with its Mahalanobis equivalent (Beugelsdijk et al., 2018). Yet, we do not know whether this result can be generalized to other cultural or institutional distance indices. The correlations shown in Tables 2 and 3 give reason for concern.

Recommandation

We think that Mahalanobis’ approach is valuable for correcting potential co-variance between the dimensions. Our analysis of the three most used cultural and institutional distance indices shows that co-variance correction matters, but need not yield radically different distance indices. In the case of Hofstede-based cultural distance, using Mahalanobis’ approach does not fundamentally alter the index as compared to a Euclidean approach and can therefore safely be ignored. For the other distance measures used here, co-variance correction matters more and should thus be carefully examined. We recommend that scholars be transparent about their approach to co-variance correction. We also think that more research is needed on leveraging different, more complex index construction methods using structural equation modeling techniques, and that researchers should explain more clearly whether they want to treat distance as a formative or a reflective construct.


3 réponses 3

Large masses can bend light, but space is largely empty. The light from distant stars and galaxies rarely passes close enough to another star or galaxy to have deviated. On the few occasions when it does, it is special and notable.

For example, the Einstein cross looks like four quasars in a (very small) square, with a galaxy in front of it. In fact it is four images of one quasar, the light having been bent by the gravity of the foreground galaxy. In this case the image of the quasar is split up and moved by a few thousanths of a degree, because there is a very exact alignment of a quasar and a galaxy.

Such examples are rare. For nearly everything else the light has travelled in a straight line through flat and empty space. The light we see pinpoints the location that the object was when the light was emitted.

An exception to this is that our own sun (and to a lesser extent the other planets) create local distortions. In very high accuracy measurements this can be taken into account. But the distortions are very small and as we know the location of the sun, they can be fully taken into account.

Although the light travels in straight lines, it can be very hard to measure the distance to stars and galaxies. Often there is considerable uncertainty on the distance of astronomical objects. But this is not a result of gravity, it is just because measuring distance is hard.

The answer by James K is probably what you want to know, but your question does touch on general relativity (the gravitational bending of light is a general-relativistic effect), so here is a little more on that aspect of it.

Your question sort of assumes that light normally travels in straight lines, that it's obvious what "straight" means, and that it always makes sense to ask what is the state of some distant portion of the universe "now." Really the definition of "straight" and "now" become pretty subtle, or even completely undefined in general relativity (GR).

In GR, we define the trajectory of a test particle through spacetime to be straight. This is called a geodesic. So a photon by definition travels "straight." However, spacetime itself is curved, so the geometry of straight lines is noneuclidean. In GR, gravity is the curvature of spacetime. For example, you can have two rays of light emitted by the same star in two different direction, and because of the gravity of some intervening object, those rays can collide later. So this is a geometry in which straight lines can intersect in more than one place.

The path of the earth through spacetime is "straight" according to GR, even though by Newtonian standards it seems like it should be curved.

GR also doesn't have a universal notion of "now." So if we ask, "how far away is that distant galaxy," implying "how far is it right à présent," there is no totally well-defined answer. The space between us and it is expanding all the time. Because cosmological models are fairly uniform, we can get away with the following workaround in the example of the distant galaxy. We define time as the time on a clock that started at the big bang, and then was at rest relative to the nearby matter since then.


Voir la vidéo: ArcGIS - Point Distance - Compute distances between several other points (Octobre 2021).