Suite

Interpolation sur un ensemble de points dans QGIS


Est-il possible d'effectuer une interpolation dans QGIS avec une entrée en tant que couche vectorielle contenant un ensemble de points collectés suivant un chemin spécifié?


La documentation QGIS donne en fait des exemples (l'un comprend des données de température) utilisant la pondération inverse de la distance et un autre exemple utilisant un TIN. assurez-vous de regarder « Problèmes courants/choses à prendre en compte » - par la page liée ci-dessus :

    1. Évaluez les données de l'échantillon. Faites-le pour avoir une idée de la façon dont les données sont distribuées dans la zone, car cela peut fournir des indications sur la méthode d'interpolation à utiliser.
    1. Appliquer une méthode d'interpolation qui convient le mieux aux données de l'échantillon et aux objectifs de l'étude. En cas de doute, essayez plusieurs méthodes, si elles sont disponibles.
    1. Comparez les résultats et trouvez le meilleur résultat et la méthode la plus appropriée. Cela peut sembler un processus fastidieux au début. Cependant, à mesure que vous acquerrez de l'expérience et des connaissances sur les différentes méthodes d'interpolation, le temps requis pour générer la surface la plus appropriée sera considérablement réduit.

il y a aussi une autre question sur l'interpolation des données de température.

je me familiarise toujours avec QGIS (bloqué dans le monde ArcGIS depuis trop longtemps) - mais en appuyant sur "Traitement-> boîte à outils", j'ai pu rechercher IDW ou triangulation (ou spline, krigeage, etc.) pour obtenir une liste de outils potentiels.


Lors de l'interpolation des points, j'ai tendance à utiliser personnellement Cartes thermiques (téléchargez le plugin Heatmap depuis Plugins > Gérer et installer les plugins… ). Vous pouvez alors trouver l'option dans Raster > Carte de chaleur:

J'ai fait une simple couche de points sous la forme d'un carré et j'ai exécuté la fonction Heatmap. J'ai ensuite mis le filtre de coloration dans le Propriétés de la couche:

Et j'obtiens ceci comme résultat :

J'espère que cela t'aides.


Analyse spatiale (interpolation)¶

Analyse spatiale est le processus de manipulation d'informations spatiales pour extraire de nouvelles informations et un sens à partir des données d'origine. Habituellement, l'analyse spatiale est effectuée avec un système d'information géographique (SIG). Un SIG fournit généralement des outils d'analyse spatiale pour calculer des statistiques d'entités et effectuer des activités de géotraitement sous forme d'interpolation de données. En hydrologie, les utilisateurs mettront probablement l'accent sur l'importance de l'analyse du terrain et de la modélisation hydrologique (modélisation du mouvement de l'eau sur et dans la terre). Dans la gestion de la faune, les utilisateurs s'intéressent aux fonctions analytiques traitant des emplacements des points de la faune et de leur relation avec l'environnement. Chaque utilisateur aura différentes choses qui l'intéressent selon le type de travail qu'il effectue.


7.4.2. Follow Along: Statistiques de base¶

Obtenez maintenant les statistiques de base pour cette couche.

  • Clique sur le Vector ‣ Outils d'analyse ‣ Statistiques de base entrée de menu.
  • Dans la boîte de dialogue qui s'affiche, spécifiez le échantillons_aléatoires couche comme source.
  • Assurez-vous que le Champ cible est réglé sur srtm_41_19.tif quel est le champ pour lequel vous calculerez les statistiques.
  • Cliquez sur d'accord. Vous obtiendrez des résultats comme celui-ci :

Vous pouvez copier et coller les résultats dans une feuille de calcul. Les données utilisent un (deux points : ) séparateur.

Pour comprendre les statistiques ci-dessus, reportez-vous à cette liste de définitions :

Moyenne La valeur moyenne (moyenne) est simplement la somme des valeurs divisée par le nombre de valeurs. StdDev L'écart type. Donne une indication de la proximité des valeurs autour de la moyenne. Plus l'écart type est petit, plus les valeurs sont proches de la moyenne. Somme Toutes les valeurs additionnées. Min La valeur minimale. Max La valeur maximale. N Le nombre d'échantillons/valeurs. CV La covariance spatiale de l'ensemble de données. Nombre de valeurs uniques Nombre de valeurs uniques dans cet ensemble de données. S'il y a 90 valeurs uniques dans un ensemble de données avec N=100, alors les 10 valeurs restantes sont identiques à une ou plusieurs les unes des autres. Plage La différence entre les valeurs minimale et maximale. Médiane Si vous organisez toutes les valeurs de la plus petite à la plus grande, la valeur médiane (ou la moyenne des deux valeurs médianes, si N est un nombre pair) est la médiane des valeurs.


Création de surfaces

La possibilité de créer une surface est un outil précieux dans un SIG. Cependant, la création de surfaces raster commence souvent par la création d'une surface vectorielle. Une méthode courante pour créer une telle surface vectorielle à partir de données ponctuelles consiste à générer des polygones de Thiessen (ou de Voronoi). Les polygones de Thiessen sont des zones générées mathématiquement qui définissent la sphère d'influence autour de chaque point de l'ensemble de données par rapport à tous les autres points (Figure 8.10 « Une surface vectorielle créée à l'aide de polygones de Thiessen »). Plus précisément, les limites des polygones sont calculées comme les bissectrices perpendiculaires des lignes entre chaque paire de points voisins. Les polygones de Thiessen dérivés peuvent ensuite être utilisés comme surfaces vectorielles brutes qui fournissent des informations attributaires sur l'ensemble de la zone d'intérêt. Un exemple courant de polygones de Thiessen est la création d'une surface de pluie à partir d'un ensemble d'emplacements de points de pluviomètre. En utilisant certaines techniques de reclassification de base, ces polygones de Thiessen peuvent être facilement convertis en représentations raster équivalentes.

Figure 8.10 Une surface vectorielle créée à l'aide de polygones de Thiessen

Alors que la création de polygones de Thiessen se traduit par une couche de polygones dans laquelle chaque polygone, ou zone raster, conserve une valeur unique, interpolation Une technique statistique potentiellement complexe qui estime la valeur de tous les points inconnus entre les points connus. est une technique statistique potentiellement complexe qui estime la valeur de tous les points inconnus entre les points connus. Les trois méthodes de base utilisées pour créer des surfaces interpolées sont la spline, la pondération de distance inverse (IDW) et la surface de tendance. La méthode d'interpolation spline force une courbe lissée à travers l'ensemble de points d'entrée connus pour estimer les valeurs intermédiaires inconnues. L'interpolation IDW estime les valeurs des emplacements inconnus à l'aide de la distance par rapport aux valeurs connues proches. Le poids accordé à la valeur de chaque valeur proximale est inversement proportionnel à sa distance spatiale par rapport au lieu cible. Par conséquent, plus le point proximal est éloigné, moins il a de poids dans la définition de la valeur du point cible. Enfin, l'interpolation de surface de tendance est la méthode la plus complexe car elle adapte un modèle de régression statistique multivariée aux points connus, en attribuant une valeur à chaque emplacement inconnu en fonction de ce modèle.

D'autres méthodes d'interpolation très complexes existent comme le krigeage. Krigeage Technique géostatistique complexe qui utilise des semi-variogrammes pour interpoler les valeurs d'une couche de points en entrée et qui s'apparente davantage à une analyse de régression. est une technique géostatistique complexe, similaire à IDW, qui utilise des semi-variogrammes pour interpoler les valeurs d'une couche de points d'entrée et s'apparente davantage à une analyse de régression (Krige 1951). Krige, D. 1951. Une approche statistique de certaines évaluations de mines et problèmes connexes au Witwatersrand. La thèse de master. Université de Witwatersrand. Les spécificités de la méthodologie de krigeage ne seront pas abordées ici car cela dépasse le cadre de ce texte. Pour plus d'informations sur le krigeage, consultez des textes de synthèse tels que Stein (1999). Stein, M. 1999. Interpolation statistique de données spatiales : quelques théories pour le krigeage. New York : Springer.


Création de surfaces

La possibilité de créer une surface est un outil précieux dans un SIG. Cependant, la création de surfaces raster commence souvent par la création d'une surface vectorielle. Une méthode courante pour créer une telle surface vectorielle à partir de données ponctuelles consiste à générer des polygones de Thiessen (ou de Voronoi). Les polygones de Thiessen sont des zones générées mathématiquement qui définissent la sphère d'influence autour de chaque point de l'ensemble de données par rapport à tous les autres points (Figure 8.10 "Une surface vectorielle créée à l'aide de polygones de Thiessen"). Plus précisément, les limites des polygones sont calculées comme les bissectrices perpendiculaires des lignes entre chaque paire de points voisins. Les polygones de Thiessen dérivés peuvent ensuite être utilisés comme surfaces vectorielles brutes qui fournissent des informations attributaires sur l'ensemble de la zone d'intérêt. Un exemple courant de polygones de Thiessen est la création d'une surface de pluie à partir d'un ensemble d'emplacements de points de pluviomètre. En utilisant certaines techniques de reclassification de base, ces polygones de Thiessen peuvent être facilement convertis en représentations raster équivalentes.

Figure 8.10 Une surface vectorielle créée à l'aide de polygones de Thiessen

Alors que la création de polygones de Thiessen aboutit à une couche de polygones dans laquelle chaque polygone, ou zone raster, conserve une valeur unique, interpolation est une technique statistique potentiellement complexe qui estime la valeur de tous les points inconnus entre les points connus. Les trois méthodes de base utilisées pour créer des surfaces interpolées sont la spline, la pondération de distance inverse (IDW) et la surface de tendance. La méthode d'interpolation spline force une courbe lissée à travers l'ensemble de points d'entrée connus pour estimer les valeurs intermédiaires inconnues. L'interpolation IDW estime les valeurs des emplacements inconnus à l'aide de la distance par rapport aux valeurs connues proches. Le poids accordé à la valeur de chaque valeur proximale est inversement proportionnel à sa distance spatiale par rapport au lieu cible. Par conséquent, plus le point proximal est éloigné, moins il a de poids dans la définition de la valeur du point cible. Enfin, l'interpolation de surface de tendance est la méthode la plus complexe car elle adapte un modèle de régression statistique multivariée aux points connus, en attribuant une valeur à chaque emplacement inconnu en fonction de ce modèle.

D'autres méthodes d'interpolation très complexes existent comme le krigeage. Krigeage est une technique géostatistique complexe, similaire à IDW, qui utilise des semi-variogrammes pour interpoler les valeurs d'une couche de points d'entrée et s'apparente davantage à une analyse de régression (Krige 1951).Krige, D. 1951. Une approche statistique de certaines évaluations de mines et problèmes connexes au Witwatersrand. Mémoire de maîtrise. Université de Witwatersrand. Les spécificités de la méthodologie de krigeage ne seront pas abordées ici car cela dépasse le cadre de ce texte. Pour plus d'informations sur le krigeage, consultez des textes de synthèse tels que Stein (1999). Stein, M. 1999. Interpolation statistique de données spatiales : quelques théories pour le krigeage. New York : Springer.


Introduction

Les cartes thermiques sont l'un des meilleurs outils de visualisation pour les données ponctuelles denses. Heatmap est une technique d'interpolation utile pour déterminer la densité des entités en entrée. Les cartes thermiques sont le plus souvent utilisées pour visualiser les données sur la criminalité, les incidents de circulation, la densité des logements, etc. La densité est calculée en fonction du nombre de points dans un emplacement, avec un plus grand nombre de points regroupés résultant en des valeurs plus élevées. Les cartes thermiques permettent une identification facile des « points chauds » et le regroupement des points. QGIS dispose d'un moteur de rendu de carte thermique qui peut être utilisé pour styliser une couche de points et d'un algorithme de traitement Heatmap (Kernel Density Estimation) qui peut être utilisé pour créer un raster à partir d'une couche de points.


Polygones de Thiessen

Les polygones de Thiessen (ou interpolation de proximité) peuvent être créés à l'aide de la fonction dirichlet de spatstat .

De nombreux packages partagent les mêmes noms de fonction. Cela peut être un problème lorsque ces packages sont chargés dans une même session R. Par exemple, la fonction d'intersection est disponible dans les packages base , spatstat et raster, qui sont tous chargés dans cette session en cours. Pour s'assurer que la bonne fonction est sélectionnée, c'est une bonne idée de faire précéder le nom de la fonction avec le nom du package comme dans raster::intersect() .

Cette astuce sera utilisée dans le prochain morceau de code lors de l'appel de la fonction idw qui est disponible à la fois dans spatstat et gstat .

Notez que la fonction dirichlet (comme la plupart des fonctions du package spatsat) nécessite que l'objet point soit au format ppp, d'où la syntaxe en ligne as.ppp(P).

La sortie IDW est un raster. Cela nécessite que nous créions d'abord une grille raster vide, puis interpolions les valeurs de précipitation dans chaque cellule de grille non échantillonnée. Une valeur de puissance IDW de 2 ( idp=2.0 ) sera utilisée.

Affiner l'interpolation

Le choix de la fonction puissance peut être subjectif. Pour affiner le choix du paramètre de puissance, vous pouvez effectuer une laisser-un-dehors routine de validation pour mesurer l'erreur dans les valeurs interpolées.

Le RMSE peut être calculé à partir de IDW.out comme suit :

Validation croisée

En plus de générer une surface interpolée, vous pouvez créer une carte d'intervalle de confiance à 95 % du modèle d'interpolation. Ici, nous allons créer une carte IC à 95% à partir d'une interpolation IDW qui utilise un paramètre de puissance de 2 ( idp=2.0 ).


Cependant, revoir la réponse à 4 cercles ci-dessus m'a conduit à une solution qui est la plus attrayante visuellement, mais surestimera les écarts de couronne extrêmement inégaux (voir ci-dessous).

Utilisez la symbologie du générateur de géométrie et générez un polygone par point avec l'expression suivante :

Cela génère 4 cercles où le point le plus externe touche les points d'étalement de la couronne cardinale, combine les cercles, puis génère une enveloppe convexe autour des cercles combinés (c'est-à-dire la plus petite géométrie qui contient tous les nœuds externes d'un ensemble de polygones)

Vous obtiendrez une couronne étalée comme ci-dessous (notez comment elle s'enroule autour des 4 cercles et comparez-la avec le polygone à 8 sommets et l'ellipse)

Pour la plupart, l'enveloppe convexe n'ira pas au-delà des mesures de propagation de la couronne cardinale, mais si vous avez une mesure beaucoup plus courte entre deux plus longues, elle ira tout de suite, contrairement à l'ellipse. Reportez-vous à l'image suivante - T080 a une propagation de la canopée de 8/12/4/12 (N/E/S/W, mètres).


Contenu

Ce tableau donne quelques valeurs d'une fonction inconnue f ( x ) .

L'interpolation fournit un moyen d'estimer la fonction à des points intermédiaires, tels que x = 2,5 .

Nous décrivons certaines méthodes d'interpolation, différant par des propriétés telles que : la précision, le coût, le nombre de points de données nécessaires et la régularité de la fonction d'interpolation résultante.

Interpolation constante par morceaux Modifier

La méthode d'interpolation la plus simple consiste à localiser la valeur de données la plus proche et à attribuer la même valeur. Dans les problèmes simples, il est peu probable que cette méthode soit utilisée, car l'interpolation linéaire (voir ci-dessous) est presque aussi facile, mais dans l'interpolation multivariée de dimension supérieure, cela pourrait être un choix favorable pour sa vitesse et sa simplicité.

Interpolation linéaire Modifier

L'une des méthodes les plus simples est l'interpolation linéaire (parfois appelée lerp). Considérons l'exemple ci-dessus d'estimation F(2.5). Puisque 2,5 est à mi-chemin entre 2 et 3, il est raisonnable de prendre F(2.5) à mi-chemin entre F(2) = 0,9093 et F(3) = 0,1411, ce qui donne 0,5252.

Généralement, l'interpolation linéaire prend deux points de données, disons (Xune,ouiune) et (Xb,ouib), et l'interpolant est donné par :

L'interpolation linéaire est rapide et facile, mais elle n'est pas très précise. Un autre inconvénient est que l'interpolant n'est pas différentiable au point Xk.

L'estimation d'erreur suivante montre que l'interpolation linéaire n'est pas très précise. Notons la fonction que l'on veut interpoler par g, et supposons que X est compris entre Xune et Xb et cela g est deux fois continûment différentiable. Alors l'erreur d'interpolation linéaire est

En mots, l'erreur est proportionnelle au carré de la distance entre les points de données. L'erreur dans certaines autres méthodes, y compris l'interpolation polynomiale et l'interpolation spline (décrites ci-dessous), est proportionnelle aux puissances plus élevées de la distance entre les points de données. Ces méthodes produisent également des interpolants plus lisses.

Interpolation polynomiale Modifier

L'interpolation polynomiale est une généralisation de l'interpolation linéaire. Notez que l'interpolant linéaire est une fonction linéaire. Nous remplaçons maintenant cet interpolant par un polynôme de degré supérieur.

Considérez à nouveau le problème donné ci-dessus. Le polynôme du sixième degré suivant passe par les sept points :

Substitution X = 2,5, on trouve que F(2.5) =

Généralement, si nous avons m points de données, il y a exactement un polynôme de degré au plus m-1 parcourant tous les points de données. L'erreur d'interpolation est proportionnelle à la distance entre les points de données et la puissance m. De plus, l'interpolant est un polynôme et donc infiniment dérivable. Ainsi, nous voyons que l'interpolation polynomiale surmonte la plupart des problèmes d'interpolation linéaire.

Cependant, l'interpolation polynomiale présente également certains inconvénients. Le calcul du polynôme d'interpolation est coûteux en calcul (voir complexité de calcul) par rapport à l'interpolation linéaire. De plus, l'interpolation polynomiale peut présenter des artefacts oscillatoires, en particulier aux extrémités (voir le phénomène de Runge).

L'interpolation polynomiale peut estimer les maxima et minima locaux qui sont en dehors de la plage des échantillons, contrairement à l'interpolation linéaire. Par exemple, l'interpolant ci-dessus a un maximum local à X ≈ 1.566, F(X) ≈ 1,003 et un minimum local à X ≈ 4.708, F(X) −1.003. Cependant, ces maxima et minima peuvent dépasser la plage théorique de la fonction - par exemple, une fonction toujours positive peut avoir un interpolant avec des valeurs négatives, et dont l'inverse contient donc de fausses asymptotes verticales.

Plus généralement, la forme de la courbe résultante, notamment pour des valeurs très élevées ou faibles de la variable indépendante, peut être contraire au sens commun, c'est-à-dire à ce que l'on sait du système expérimental qui a généré les points de données. Ces inconvénients peuvent être réduits en utilisant l'interpolation spline ou en restreignant l'attention aux polynômes de Chebyshev.

Interpolation de spline Modifier

Rappelez-vous que l'interpolation linéaire utilise une fonction linéaire pour chacun des intervalles [Xk,Xk+1]. L'interpolation spline utilise des polynômes de faible degré dans chacun des intervalles et choisit les pièces polynomiales de manière à ce qu'elles s'emboîtent harmonieusement. La fonction résultante est appelée une spline.

Par exemple, la spline cubique naturelle est cubique par morceaux et dérivable deux fois en continu. De plus, sa dérivée seconde est nulle aux extrémités. La spline cubique naturelle interpolant les points dans le tableau ci-dessus est donnée par

Dans ce cas on obtient F(2.5) = 0.5972.

Comme l'interpolation polynomiale, l'interpolation spline entraîne une erreur plus faible que l'interpolation linéaire, tandis que l'interpolant est plus lisse et plus facile à évaluer que les polynômes de haut degré utilisés dans l'interpolation polynomiale. Cependant, le caractère global des fonctions de base conduit à un mauvais conditionnement. Ceci est complètement atténué par l'utilisation de splines de support compact, telles que celles implémentées dans Boost.Math et discutées dans Kress. [2]

Le processus gaussien est un puissant outil d'interpolation non linéaire. De nombreux outils d'interpolation populaires sont en fait équivalents à des processus gaussiens particuliers. Les processus gaussiens peuvent être utilisés non seulement pour ajuster un interpolant qui passe exactement par les points de données donnés, mais aussi pour la régression, c'est-à-dire pour ajuster une courbe à travers des données bruitées. Dans la communauté géostatistique, la régression du processus gaussien est également connue sous le nom de krigeage.

D'autres formes d'interpolation peuvent être construites en choisissant une classe différente d'interpolants. Par exemple, l'interpolation rationnelle est interpolation par des fonctions rationnelles utilisant l'approximant de Padé, et l'interpolation trigonométrique est une interpolation par des polynômes trigonométriques utilisant des séries de Fourier. Une autre possibilité est d'utiliser des ondelettes.

La formule d'interpolation Whittaker-Shannon peut être utilisée si le nombre de points de données est infini ou si la fonction à interpoler a un support compact.

Parfois, on connaît non seulement la valeur de la fonction que l'on veut interpoler, en certains points, mais aussi sa dérivée. Cela conduit à des problèmes d'interpolation d'Hermite.

Lorsque chaque point de données est lui-même une fonction, il peut être utile de voir le problème d'interpolation comme un problème d'advection partielle entre chaque point de données. Cette idée conduit au problème d'interpolation de déplacement utilisé dans la théorie des transports.

L'interpolation multivariée est l'interpolation de fonctions de plusieurs variables. Les méthodes comprennent l'interpolation bilinéaire et l'interpolation bicubique en deux dimensions, et l'interpolation trilinéaire en trois dimensions. Ils peuvent être appliqués à des données maillées ou dispersées.


Exemples d'applications d'interpolation

Quelques exemples typiques d'applications pour les outils d'interpolation suivent. Les illustrations d'accompagnement montreront la distribution et les valeurs des points d'échantillonnage et le raster généré à partir d'eux.

Interpoler une surface de pluie

L'entrée ici est un ensemble de données ponctuelles de valeurs de niveau de précipitations connues, illustrées par l'illustration de gauche. L'illustration de droite montre un raster interpolé à partir de ces points. Les valeurs inconnues sont prédites à l'aide d'une formule mathématique qui utilise les valeurs des points connus proches.

Interpolation d'une surface d'altitude

Une utilisation typique de l'interpolation de points consiste à créer une surface d'altitude à partir d'un ensemble de mesures d'échantillons.

Dans le graphique suivant, chaque symbole de la couche de points représente un emplacement où l'altitude a été mesurée. En interpolant, les valeurs de chaque cellule entre ces points d'entrée seront prédites.

Interpoler une surface de concentration

Dans l'exemple ci-dessous, les outils d'interpolation ont été utilisés pour étudier la corrélation de la concentration d'ozone sur les maladies pulmonaires en Californie. L'image de gauche montre les emplacements des stations de surveillance de l'ozone. L'image de droite affiche la surface interpolée, fournissant des prédictions pour chaque emplacement en Californie. La surface a été dérivée par krigeage.

Modèles de pollution et pondération inverse de la distance : quelques remarques critiques de Louis de Mesnard


Voir la vidéo: QGIS-Styling layers through properties dialog box (Octobre 2021).