Rechercher des agrégats de points (Map Viewer)

L’outil Find Point Clusters (Rechercher des agrégats de points) identifie les agrégats d’entités ponctuelles dans le bruit environnant en fonction de leur distribution spatiale.

Exemples

Voici des exemples d'utilisation de cet outil :

  • Une organisation spécialiste d’une maladie parasitaire particulière souhaite identifier où, dans sa zone d’étude, commencer le traitement et l’extermination des parasites. Un analyste dispose d’un jeu de données représentant les ménages infestés et non infestés dans la zone d’étude. Il utilise l’outil Find Point Clusters (Rechercher des agrégats de points) pour identifier le plus gros agrégat de ménages infestés.
  • Une organisation menant des interventions d’urgence doit déterminer où déployer ses ressources de sauvetage et d’évacuation suite à une catastrophe naturelle. Un analyste utilise l’outil Find Point Clusters (Rechercher des agrégats de points) pour identifier des agrégats de tweets géolocalisés mentionnant l’événement. À partir de la taille et de la localisation des agrégats, l’organisation va cartographier la zone touchée et informer ses équipes de secours.

Remarques sur l’utilisation

L’outil Rechercher des agrégats de points inclut des configurations pour les entités en entrée, les paramètres d’agrégation et la couche de résultat.

Entités en entrée

Le groupe Input features (Entités en entrée) inclut le paramètre Input layer (Couche en entrée), qui représente la couche contenant les entités ponctuelles qui vont être regroupées en agrégats en fonction de leur distribution spatiale.

Remarque :

La projection Web Mercator ne convient pas pour l’analyse spatiale. Si le système de référence spatiale de la couche en entrée est WGS 1984 Web Mercator (Sphère auxiliaire), les données sont converties en système de coordonnées géographiques afin d’utiliser les distances de corde dans l’analyse.

Paramètres d’agrégation

Le groupe Cluster settings (Paramètres d’agrégation) comprend les paramètres suivants :

  • Clustering method (Méthode d’agrégation) indique la méthode utilisée pour identifier les agrégats.
    • Defined distance (DBSCAN) (Distance définie (DBSCAN)) : identifie les agrégats en recherchant dans une distance de recherche spécifique. Cette méthode est appropriée lorsque tous les agrégats significatifs ont des densités similaires.
    • Self-adjusting (HDBSCAN) [Ajustement automatique] — utilise une plage de distances pour séparer les agrégats de diverses densités du bruit plus clairsemé. Cette méthode est la méthode d’agrégation la plus axée sur les données et ne nécessite de ce fait pas de distance de recherche.
    • Multi-scale (OPTICS) (Multi-échelle (OPTICS)) : identifie les agrégats à l’aide de la distance entre les voisins et d’un diagramme d’accès. La méthode détermine d’abord la distance d’accès minimale pour tous les points. La distance d’accès minimale est la distance entre un point et son voisin le plus proche qui n’a pas encore été visité par la recherche. Une fois que la distance d’accès minimale pour tous les points est déterminée, l’outil construit un diagramme d’accès. Le diagramme d’accès trace l’ordre d’accès de chaque point et sa distance d’accès en révélant la structure d’agrégation des points. Cette méthode utilise ensuite la valeur Cluster sensitivity (Sensibilité d’agrégation) pour identifier les agrégats. Tout comme la méthode HDBSCAN, la méthode OPTICS peut identifier les agrégats de diverses densités.
  • Minimum points per cluster (Nombre minimal de points par agrégat) représente le nombre minimal de points qui sera utilisé pour considérer qu’un regroupement de points constitue un agrégat. En général, plus la valeur est faible, plus le nombre d’agrégats détectés sera élevé. Cette valeur doit être inférieure ou égale au nombre de points inclus dans la couche. La valeur minimale prise en charge est 2.
  • Search distance (Distance de recherche) spécifie la distance maximale autour de chaque point à prendre en compte. Si la valeur Clustering method (Méthode d’agrégation) est Defined distance (DBSCAN) (Distance définie (DBSCAN)), la valeur Search distance (Distance de recherche) est la distance maximale autour de chaque entité ponctuelle dans l’agrégat jusqu’à laquelle les points pouvant être inclus dans l’agrégat doivent être recherchés. Si le nombre minimal de points est trouvé dans la distance de recherche d’un point donné, ce point est considéré comme point principal. Si le nombre minimal de points n’est pas trouvé dans la distance de recherche d’un point donné, mais que ce point se trouve dans la distance de recherche du point principal, le point est considéré comme point de bordure. Les agrégats seront composés à la fois de points principaux et de points de bordure. Si la valeur Clustering method (Méthode d’agrégation) est Multi-scale (OPTICS) (Multi-échelle (OPTICS)), la valeur Search distance (Distance de recherche) est la distance maximale autour de chaque point jusqu’à laquelle les points doivent être recherchés pour affecter une distance d’accès. La distance d’accès est la distance entre un point et son voisin le plus proche qui n’a pas encore été visité par la recherche. La distance principale est affectée comme distance d’accès aux points situés dans la distance principale d’un point. La distance principale d’un point est une mesure de la distance requise pour se rendre de chaque point jusqu’au nombre minimal d’entités défini.
  • Search distance unit (Unité de distance de recherche) indique les unités pour la valeur Search distance (Distance de recherche).
  • Cluster Sensitivity (Sensibilité d’agrégation) indique de quelle manière la forme (à la fois la pente et la hauteur) des pics dans le diagramme d’accès sera utilisée pour séparer les agrégats. Le diagramme d’accès trace l’ordre d’accès des points et leur distance d’accès. Une valeur Cluster Sensitivity (Sensibilité d’agrégation) très élevée (proche de 100) traitera même les plus petits pics dans le diagramme d’accès en tant que séparation entre les agrégats. Une valeur Cluster Sensitivity (Sensibilité d’agrégation) très faible (proche de 0) traitera uniquement les pics les plus abrupts et élevés dans le diagramme d’accès en tant que séparation entre les agrégats. Si elle n’est pas indiquée, l’outil trouvera une valeur de sensibilité à l’aide de la divergence de Kullback-Leibler.

Couche de résultat

Le groupe Result layer (Couche de résultat) comprend les paramètres suivants :

  • Le paramètre Output name (Nom en sortie) détermine le nom de la couche créée et ajoutée à la carte. Le nom doit être unique. Si une couche du même nom existe déjà dans votre organisation, l’outil échoue et vous êtes invité à utiliser un autre nom.
  • Le paramètre Save in folder (Enregistrer dans un dossier) indique le nom d’un dossier de My Content (Mon contenu) dans lequel est enregistré le résultat.

Environnements

Les paramètres d’environnement d’analyse sont des paramètres supplémentaires qui affectent les résultats d’un outil. Vous pouvez accéder aux paramètres d’environnement d’analyse de l'outil à partir du groupe de paramètres Environment settings (Paramètres d'environnement).

Cet outil respecte les environnements d'analyse suivants :

  • Système de coordonnées en sortie
  • Etendue de traitement
    Remarque :

    L’étendue de traitement par défaut dans Map Viewer correspond à l’étendue Full extent (Étendue totale). Ce paramètre par défaut diffère de Map Viewer Classic, où Use current map extent (Utiliser l’étendue courante de la carte) est activé par défaut.

Sorties

L’outil génère une couche ponctuelle en sortie. Si la valeur du paramètre Clustering Method (Méthode d’agrégation) est Self-adjusting (HDBSCAN) (Ajustement automatique [HDBSCAN]) ou Multi-scale (OPTICS) (Multi-échelle [OPTICS]), l’outil génère également un diagramme. La couche en sortie de toutes les options Clustering method (Méthode d’agrégation) inclura les champs Cluster ID, Source ID et Color ID. Le champ Cluster ID identifie l’agrégat auquel chaque point appartient. Les points de bruit ont la valeur -1. La valeur du champ Source ID est un identifiant unique. La valeur du champ Color ID représente la couleur attribuée à un point et son agrégat. Si la couche en sortie comporte plus de neuf agrégats, chaque couleur est attribuée à plusieurs agrégats. Néanmoins, des couleurs différentes sont attribuées aux agrégats voisins pour continuer de les distinguer visuellement. Si la valeur du paramètre Clustering method (Méthode d’agrégation) est Self-adjusting (HDBSCAN) (Ajustement automatique (HDBSCAN)), la couche ponctuelle en sortie contiendra les champs supplémentaires suivants :

  • Probability Est une valeur entre 0 et 1 qui indique la probabilité qu’un point appartienne à son agrégat attribué. Les points de bruit ont la valeur 0.
  • Outlier Est une valeur entre 0 et 1 qui indique si un point est susceptible d’être un point aberrant au sein de son propre agrégat. Les points de bruit sont considérés comme un seul agrégat. Une valeur élevée indique que le point est plus susceptible d’être un point aberrant.
  • Exemplar Est une valeur entre 0 et 1 qui indique si un point est particulièrement représentatif de son agrégat.
  • Stability Est une valeur qui reflète la persistance de chaque agrégat dans une plage d’échelles. Une valeur supérieure indique qu’un agrégat persiste sur une plage plus vaste d’échelles de distance.

Si la valeur du paramètre Clustering method (Méthode d’agrégation) est Multi-scale (OPTICS) (Multi-échelle (OPTICS)), la couche en sortie contiendra les champs supplémentaires suivants :

  • Reachability order est la façon dont les entités en entrée ont été triées pour l’analyse
  • Reachability distance est la distance entre chaque point et son voisin le plus proche qui n’a pas encore été visité.

Si la valeur du paramètre Clustering Method (Méthode d’agrégation) est Self-adjusting (HDBSCAN) (Ajustement automatique [HDBSCAN]) ou Multi-scale (OPTICS) (Multi-échelle [OPTICS]), l’outil génère un diagramme. Multi-scale (OPTICS) (Multi-échelle [OPTICS]) génère un diagramme d’accès qui peut servir à évaluer la densité de chaque agrégat. Self-adjusting (HDBSCAN) (Ajustement automatique [HDBSCAN]) génère une distribution du diagramme de probabilité d’appartenance, qui affiche la distribution de la probabilité qu’une entité appartienne à son agrégat attribué. Pour afficher le diagramme, cliquez sur Charts (Diagrammes) dans la barre d’outils Contents (Contenu).

Vous pouvez afficher des détails supplémentaires sur l’analyse dans la page des éléments de la couche en sortie. Pour accéder à la page des éléments de la couche, cliquez sur Analysis (Analyse) Analyse dans la barre d’outils Settings (Paramètres) . Cliquez sur History (Historique), puis recherchez l’exécution d’outil réussie et cliquez dessus. Les détails de l’analyse apparaissent dans l’onglet Results (Résultats). Cliquez sur le bouton d’options en regard de la couche en sortie, puis cliquez sur Open item details (Ouvrir les détails de l’élément).

Licences requises

Cet outil requiert les licences et configurations suivantes :

  • Type d’utilisateur Creator ou GIS Professional
  • Rôle d’éditeur ou d’administrateur, ou rôle personnalisé équivalent

Ressources

Référez-vous aux ressources suivantes pour en savoir plus :