Remarque :
Cette fonction n’est pas encore prise en charge dans Map Viewer Classic (anciennement Map Viewer). Elle sera disponible dans une prochaine version de Map Viewer.
L’outil Rechercher les points chauds détermine si le modèle spatial de vos données présente des agrégations statistiquement significatives.
Diagramme de workflow
Exemples
Le commissariat de police d'une ville réalise une analyse afin de déterminer s'il existe une relation entre les crimes violents et le taux de chômage. Un programme d’emplois saisonniers sera mis en place à destination des lycéens ans les zones où les taux de crimes violents et de chômage sont élevés. L'outil Trouver des points chauds permet de trouver des zones présentant des points chauds de crimes et chômage statistiquement significatifs.
Un stratège politique souhaite savoir quelles régions ont manifesté un soutien plus fort ou plus faible pour un parti politique lors des dernières élections. Cette information peut aider à orienter des stratégies de campagnes électorales à venir. Il soustrait la proportion des votes démocrates de la proportion des votes républicains, puis utilise Trouver des points chauds pour trouver les points chauds et froids dans ces écarts. Les points chauds (rouge) représentent un soutien fort aux Républicains, et les points froids (bleu) un soutien fort aux Démocrates.
Un agent des services de protection de l'environnement étudie les maladies des arbres pour accorder les priorités aux zones forestières à traiter et pour en savoir plus sur les zones qui montrent une certaine résistance. L'outil Trouver des points chauds permet de localiser les groupes d'arbres malades (points chauds) et d'arbres sains (points froids).
Remarques sur l’utilisation
Les entités en entrée peuvent être des points ou des surfaces.
Le paramètre Rechercher des grappes de valeurs élevées et faibles permet d’évaluer la disposition spatiale des entités. Si vos entités sont des surfaces, un champ doit être sélectionné. L'agrégation sera déterminée en utilisant les nombres contenus dans le champ sélectionné. Les entités ponctuelles peuvent être analysées grâce à un champ ou à l'option Nombre de points. Si Nombre de points est utilisé, l’outil détermine si les points eux-mêmes sont agrégés, plutôt que si des grappes de valeurs élevées et faibles sont présentes.
Si des points sont en cours d'analyse avec Nombre de points, deux autres options seront disponibles. Le paramètre Comptabiliser les points dans permet d’agréger des points dans une Grille de quadrillage, une Grille hexagonale ou une couche de zones à partir de la fenêtre Contenu, par exemple des comtés ou des codes postaux. Le paramètre Définir où des points sont possibles permet de créer une ou plusieurs zones d'intérêt. Les trois options de ce paramètre sont Aucun, ce qui signifie que tous les points sont utilisés, qu’une zone est définie par une couche de zones provenant de la fenêtre Contenu et que des zones sont créées avec l’outil Dessiner.
Vous pouvez normaliser vos données en utilisant le paramètre Diviser par. Les données Population Esri utilisent GeoEnrichment et entraînent la consommation de crédits. Une autre option consiste à normaliser l’utilisation d’un champ à partir de la couche en entrée (disponible lorsque le paramètre Rechercher des grappes de valeurs élevées et faibles est défini sur un champ, plutôt que le paramètre Nombre de points). Les valeurs qui peuvent être utilisées pour la normalisation sont le nombre de foyers ou la zone.
Remarque :
Les données Population Esri ne sont pas disponibles pour le paramètre Diviser par si un service personnalisé GeoEnrichment est configuré dans votre organisation.
Vous pouvez utiliser le menu déroulant Options pour définir une valeur Taille de cellule ou une valeur Canal de distance spécifique pour votre analyse.
La couche en sortie comporte des champs supplémentaires contenant des informations telles que la signification statistique de chaque entité, la valeur de p et le score z. La couche en sortie contient également des informations concernant l’analyse statistique dans la section Description de sa page Détails des éléments.
Fonctionnement de Trouver des points chauds
Même les modèles spatiaux aléatoires présentent un certain degré d'agrégation. En outre, nos yeux et notre cerveau tentent naturellement d'identifier des modèles même si aucun n'existe. Par conséquent, il peut être difficile de savoir si les modèles de vos données sont le résultat de processus spatiaux en cours ou s’ils découlent simplement du hasard. C’est la raison pour laquelle les chercheurs et les analystes utilisent des méthodes statistiques, telles que Trouver des points chauds (Getis-Ord Gi*) pour quantifier les modèles spatiaux.
L’outil Trouver des points chauds permet de calculer les statistiques Getis-Ord Gi* de chaque entité d’un jeu de données. Les scores z et valeurs p obtenus vous indiquent l'endroit où les entités de valeurs élevées ou faibles sont agrégées spatialement. L’outil Rechercher les points chauds calcule les valeurs par défaut optimales selon les caractéristiques des données en entrée et applique automatiquement une correction FDR (False Discovery Rate). Chaque entité est analysée dans le contexte des entités voisines. Une entité dotée d'une valeur élevée est intéressante, mais il ne s'agit pas forcément d'un point chaud statistiquement significatif. Pour être un point chaud statistiquement significatif, une entité doit avoir une valeur élevée et être entourée d’autres entités dotées de valeurs élevées. La somme locale d’une entité et de ses voisins est comparée proportionnellement à la somme de toutes les entités. Lorsque la somme locale est très différente de la somme locale attendue, et si la différence est trop importante pour n’être que le fruit du hasard, un score z statistiquement significatif est généré.
La réalisation d'une agrégation statistiquement significative sur vos données permet d'obtenir des informations précieuses. Le fait de savoir où et quand l'agrégation se produit peut fournir des indications importantes sur les processus qui favorisent les modèles auxquels vous assistez. Par exemple, savoir que le nombre de cambriolages résidentiels est plus élevé dans certains quartiers constitue une information clé si vous devez mettre en place des stratégies de prévention efficaces, allouer des ressources policières limitées, initier des programmes de surveillance de quartier, autoriser des enquêtes criminelles approfondies ou identifier des suspects potentiels.
Analyser les entités surfaciques
Des données sont disponibles pour les entités surfaciques telles que les secteurs de recensement, les comtés, les circonscriptions électorales, les secteurs hospitaliers, les parcelles, les limites de parcs et de zones de loisirs, les bassins versants, les classifications d'occupation du sol et les zones climatiques. Lorsque votre couche d’analyse contient des entités surfaciques, vous devez définir un champ numérique qui sera utilisé pour rechercher des grappes de valeurs élevées et faibles. Ce champ peut représenter les éléments suivants :
- Des nombres (par exemple, le nombre de ménages)
- Des taux (par exemple, la proportion de la population détentrice d'une licence universitaire)
- Des moyennes (par exemple, le revenu moyen ou médian des ménages)
- Des indices (par exemple, un score indiquant si les dépenses des ménages en équipement sportif se situe en-deçà ou au-delà de la moyenne nationale)
Grâce au champ que vous fournissez, l’outil Trouver des points chauds crée une carte (la couche de résultat) qui montre les zones présentant des grappes statistiquement significatives de valeurs élevées (points chauds : rouges) et de valeurs faibles (points froids : bleus).
Analyser les entités ponctuelles
Diverses données sont disponibles comme entités ponctuelles. Parmi les exemples d'entités fréquemment représentées par des points, citons les incidents criminels, les écoles, les hôpitaux, les appels d'urgence, les accidents de la route, les puits d'eau, les arbres et les bateaux. Vous pouvez souhaiter analyser des valeurs de données (champ) associées à chaque entité ponctuelle. Dans d’autres cas, vous vous intéressez uniquement à l’évaluation des grappes de points. La décision de fournir un champ dépend de la question que vous posez.
Rechercher des grappes de valeurs élevées et faibles associées à des entités ponctuelles
Indiquez un champ d’analyse pour répondre à des questions telles que : Où les valeurs anormalement élevées et faibles s’agrègent-elles ? Le champ que vous sélectionnez peut représenter ce qui suit :
- Des nombres (par exemple le nombre d'accidents de circulation aux intersections de rues)
- Des taux (par exemple, le chômage urbain, où chaque ville est représentée en tant qu'entité ponctuelle)
- Des moyennes (par exemple, le résultat moyen des écoles)
- Des indices (par exemple, de satisfaction des clients pour les concessions automobiles à travers le pays)
Rechercher des grappes de nombres de points élevées et faibles
Dans le cas de certaines données ponctuelles (généralement lorsque chaque point représente un événement, un incident ou une indication de présence/absence), aucun champ d’analyse ne coule de source. Vous pouvez savoir où l’agrégation est inhabituellement (statistiquement significative) intense ou faible.. Pour cette analyse, les entités surfaciques (une grille de quadrillage que l’outil crée ou une couche de surface que vous fournissez) sont placées par dessus les points et le nombre de points dans chaque surface est compté. L'outil recherche ensuite de grappes de nombres de points élevées et faibles associées à chaque entité surfacique.
Définir où des points sont possibles
Spécifiez une couche surfacique ou dessinez des zones définissant une zone d'étude dans laquelle vous souhaitez que l'analyse soit effectuée dans tous les emplacements où les entités ponctuelles d'incidents peuvent se produire. Pour cette option, l’outil Trouver des points chauds superpose sur votre zone d’étude définie une grille de quagrillage et compte les points se trouvant dans chaque carré du maillage. Si vous n’indiquez pas par cette option où les points d’incidents peuvent se trouver, l’outil Trouver des points chauds analyse uniquement les carrés du maillage qui contiennent au moins un point. Lorsque vous utilisez cette option pour définir où les points peuvent se trouver, l'analyse est effectuée sur tous les carrés du maillage se trouvant dans les zones délimitées que vous définissez.
Comptez les points au sein de vos propres zones d’agrégation
Dans certains cas, les entités surfaciques telles que les secteurs de recensements, les secteurs de police ou les parcelles ont plus de sens pour l’analyse que la grille de quadrillage par défaut.
Choisir l'option de division
Il existe deux méthodes courantes d'identification des points chauds ou froids :
- Par nombre : lorsque vous analysez un jeu de données particulier, vous pouvez souhaiter trouver les points chauds et froids du nombre d'entités au sein de chaque zone d'agrégation de votre zone d'étude. Vous pouvez, par exemple, rechercher les points chauds dans lesquels le plus grand nombre de délits a été perpétré et les points froids dans lesquels le plus faible nombre de délits est survenu, afin d'allouer des ressources.
- Par intensité : il peut s'avérer utile d'analyser et de comprendre les modèles en tenant compte des répartitions sous-jacentes qui ont une incidence sur un phénomène particulier. C'est ce que l'on appelle souvent la normalisation, soit le processus de division d'une valeur attributaire numérique par une autre valeur afin de réduire les différences de valeurs selon la taille des surfaces ou le nombre d'entités de chaque surface. Par exemple, dans le cas de la criminalité, vous pouvez souhaiter connaître la répartition des grappes de forts et faibles taux de criminalité en tenant compte de la population sous-jacente. Dans ce cas, vous pouvez compter le nombre de délits dans chaque zone (que cette zone soit une grille de quadrillage ou un jeu de données surfacique différent) et diviser ce total par la population totale de la zone. Cela donne un taux de criminalité, soit le nombre de délits par personne. La recherche de points chauds et froids de criminalité par personne répond à une question différente qui permet également de prendre des décisions avisées.
Les deux façons d'analyser les données au sein de votre zone d'analyse sont valides. Tout dépend de la question que vous posez.
Le choix de l’attribut adéquat en fonction duquel effectuer la division est important. Vous devez confirmer que le paramètre Diviser par est un paramètre qui a une incidence dans les faits sur la répartition d’un phénomène donné que vous analysez.
Lorsque vous sélectionnez l’attribut Diviser par Esri Population, les données relatives à la population issues de Esri Demographics Global Coverage sont utilisées. Confirmez que la résolution des données disponibles pour la zone qui vous intéresse est compatible avec la taille des zones en cours d’enrichissement (soit des zones d’agrégation que vous fournissez soit des carrés de quadrillage en cours de création).
Interpréter les résultats
La sortie de l'outil Trouver les points chauds est une carte. Pour les points ou les surfaces dans cette carte de couche de résultat, plus la couleur rouge ou bleue est foncée et plus vous pouvez être certain que l'agrégation n'est pas le fruit du hasard. Les points ou surfaces qui s’affichent en beige, d’un autre côté, ne font pas partie d’une grappe statistiquement significative. Le modèle spatial associé à ces entités peut être le fruit du hasard. Il peut arriver que les résultats de votre analyse n’indiquent aucune grappe statistiquement significative. Ces informations sont importantes. Lorsqu'un motif spatial est aléatoire, vous n'avez aucune indication des causes sous-jacentes. Dans ce cas, toutes les entités de la couche de résultat apparaissent en beige. Cependant, lorsque vous détectez une agrégation statistiquement significative, les emplacements où surviennent l’agrégation sont des indications importantes quant à ses origines. Par exemple, la recherche d'agrégations spatiales statistiquement significatives de cas de cancers associés à certaines toxines présentes dans l'environnement, par exemple, peut contribuer à la mise en place de stratégies et de campagnes de protection de la population. De la même façon, les points froids d'obésité infantile associés à des programmes d'incitation à la pratique de sport en dehors de l’école peuvent justifier la promotion à plus grande échelle de ce type de programmes.
Dépanner
La méthode statistique utilisée par l'outil Trouver des points chauds repose sur la loi des probabilités et, par conséquent, nécessite un nombre minimal d'entités pour être efficace. Cette méthode statistique requiert également différents nombres ou valeurs de champ d'analyse. Si vous analysez les délits par secteur de recensement, par exemple, et que vous obtenez exactement le même nombre de délits dans chaque secteur, l’outil ne peut pas fonctionner. Le tableau suivant offre une explication des messages susceptibles d'apparaître lorsque vous utilisez l'outil Trouver des points chauds :
Message | Problème | Solution |
---|---|---|
Les options d'analyse que vous avez sélectionnées requièrent un minimum de 60 points pour calculer les points chauds et froids. | Votre couche d'analyse des points ne comporte pas assez d'entités ponctuelles pour parvenir à des résultats fiables. | Ajouter d’autres points à votre couche d’analyse. Vous pouvez également définir des zones d’analyse d’emprise et ajouter des informations sur l’endroit où des points auraient pu se produire. Cette méthode nécessite au moins 30 points. Vous pouvez également fournir des zones d’agrégation qui superposent vos points. Vous avez besoin d’au moins 30 zones surfaciques et de 30 points à l’intérieur de ces zones pour cette analyse. Si vous possédez 30 points au moins, vous pouvez spécifier un champ d’analyse. Dans ce cas, la question n'est plus de savoir où se trouvent les nombres élevés et faibles de points, mais où les valeurs de champ d'analyse élevées et faibles s'agrègent spatialement. |
Les options d'analyse que vous avez sélectionnées requièrent un minimum de 30 points avec des données valides dans le champ d'analyse afin de calculer les points chauds et froids. | Votre couche d’analyse ne comporte pas assez de points ou pas assez de points associés à des valeurs de champ d’analyse autres que null pour parvenir à des résultats fiables. | Si vous avez moins de 30 points, cette méthode d’analyse ne convient pas à vos données. Si vous avez plus de 30 points et que vous voyez ce message, le champ d’analyse que vous avez spécifié comporte peut-être des valeurs null. Les points comportant des valeurs de champ d’analyse null sont ignorés. Il est également possible qu’un filtre actif réduise le nombre de points disponibles pour l’analyse. |
Les options d'analyse que vous avez sélectionnées requièrent un minimum de 30 polygones avec des données valides dans le champ d'analyse afin de calculer les points chauds et froids. | Votre couche d’analyse ne comporte pas assez de zones surfaciques ou pas assez d’entités surfaciques associées à des valeurs de champ d’analyse autres que null pour parvenir à des résultats fiables. | Si vous avez moins de 30 zones surfaciques, cette méthode d’analyse ne convient pas à vos données. Si vous avez plus de 30 zones et que vous voyez ce message, le champ d’analyse que vous avez spécifié comporte peut-être des valeurs null. Les zones surfaciques comportant des valeurs de champ d'analyse null sont ignorées. Il est également possible qu’un filtre actif réduise le nombre de zones surfaciques disponibles pour l’analyse. |
L'option d'analyse que vous avez sélectionnée requiert un minimum de 30 points à l'intérieur des zones surfaciques d'emprise. | Seuls les points qui se trouvent à l’intérieur des zones d’analyse d’emprise que vous dessinez ou fournissez sont analysés. Pour obtenir des résultats fiables, 30 points au moins doivent se trouver à l'intérieur des zones d'analyse d'emprise. | Si vous n’avez pas 30 points au moins, cette méthode ne convient pas à vos données. Avec un minimum de 30 entités, la solution consiste souvent à indiquer des zones d’analyse d’emprise différentes, voire plus grandes. Vous pouvez également fournir une couche surfacique avec un minimum de 30 polygones d’agrégation qui superposent au moins 30 de vos points. Lorsque vous fournissez les zones d'agrégation, l'analyse est réalisée sur le nombre de points au sein de chaque zone. |
L'option d'analyse que vous avez sélectionnée requiert un minimum de 30 points à l'intérieur des polygones d'agrégation. | Seuls les points qui se trouvent à l’intérieur des polygones d’agrégation sont inclus dans l’analyse. Pour obtenir des résultats fiables, 30 points au moins doivent se trouver à l'intérieur des zones surfaciques que vous fournissez. | Si vous ne disposez pas d’au moins 30 points, cette méthode ne convient pas à vos données. Sinon, vous devez dessiner ou fournir des zones d’analyse d’emprise qui se superposent à au moins 30 de vos points. Les zones d'emprise doivent refléter tous les emplacements où les points sont susceptibles de se produire. |
L'option d'analyse que vous avez sélectionnée requiert un minimum de 30 zones d'agrégation. | L’option que vous avez sélectionnée permet de superposer les zones d’agrégation par dessus vos points, puis de comptabiliser les points qui se trouvent à l’intérieur de chaque zone. Un minimum de 30 (30 zones) est nécessaire pour parvenir à des résultats fiables. | Des résultats fiables peuvent être obtenus si vous fournissez un minimum de 30 points se trouvant au sein d'un minimum de 30 zones d'agrégation. Si vous n’avez pas 30 zones d’agrégation, vous pouvez dessiner ou fournir des zones d’analyse d’emprise superposant au moins 30 de vos points. Ces zones d'emprise doivent refléter tous les emplacements où les points sont susceptibles de se produire. |
Les points chauds et froids ne peuvent pas être calculés si le nombre de points dans chaque zone surfacique est identique. Essayez différentes zones surfaciques ou différentes options d'analyse. | Lorsque l'outil Trouver des points chauds a comptabilisé le nombre de points au sein de chaque zone surfacique, il a trouvé que les nombres étaient identiques. Pour générer des résultats, cet outil requiert un degré minimal de variation dans les nombres obtenus. | Vous pouvez fournir d’autres zones d’agrégation afin que toutes les zones n’aient pas le même nombre de points exactement. Au lieu des zones d’agrégation, vous pouvez également dessiner ou fournir des zones d’analyse d’emprise. Vous pouvez spécifier un champ d'analyse. Toutefois, dans ce cas la question n'est plus de savoir où se trouvent les nombres élevés et faibles de points, mais où les valeurs de champ d'analyse élevées et faibles s'agrègent spatialement. |
La variation est insuffisante dans les emplacements des points pour calculer les points chauds et froids. Les points coïncidents, par exemple, réduisent la variation spatiale. Vous pouvez essayer de fournir une zone d'emprise, des zones d'agrégation (30 au minimum) ou un champ d'analyse. | En fonction du nombre de points et de leur répartition, l'outil crée une grille pour superposer vos points. Après avoir comptabilisé le nombre de points qui se trouvent au sein de chaque carré du quadrillage et avoir supprimé les carrés dont le nombre de points est nul, il restait moins de 30 carrés. Cet outil requiert un minimum de 30 (30 carrés) pour parvenir à des résultats fiables. | Si vos points occupent peu d’endroits uniques (s’il y a beaucoup de points coïncidents), une solution consiste à fournir des zones d’agrégation qui superposent vos points ou à dessiner ou fournir des zones d’analyse d’emprise indiquant où les points peuvent ou non se produire. Vous pouvez également spécifier un champ d'analyse. Toutefois, dans ce cas la question n'est plus de savoir où se trouvent les nombres élevés et faibles de points, mais où les valeurs de champ d'analyse élevées et faibles s'agrègent spatialement. |
La variation est insuffisante parmi les points au sein des zones surfaciques d'emprise. Vous pouvez essayer de fournir des limites plus vastes. | En fonction des emplacements des points et du nombre de points, l'outil crée une grille pour superposer vos points. Après avoir comptabilisé le nombre de points qui se trouvent à l’intérieur de chaque carré du quadrillage et avoir supprimé les carrés qui se trouvent à l’extérieur des zones d’analyse d’emprise, il restait moins de 30 carrés de quadrillage. Cet outil requiert un minimum de 30 (30 carrés) pour parvenir à des résultats fiables. | Si vos points se trouvent à différents emplacements à l'intérieur des zones d'analyse d'emprise, vous pouvez peut-être simplement créer ou fournir des limites plus vastes. Si vos points occupent peu d’endroits uniques (s’il y a beaucoup de points coïncidents), une solution consiste à fournir des zones d’agrégation qui superposent vos points. Vous pouvez également spécifier un champ d'analyse. Toutefois, dans ce cas la question n'est plus de savoir où se trouvent les nombres élevés et faibles de points, mais où les valeurs de champ d'analyse élevées et faibles s'agrègent spatialement. |
Toutes les valeurs de votre champ d'analyse sont probablement les mêmes. Les points chauds et froids ne peuvent pas être calculés si le champ en cours d'analyse ne présente aucune variation. | Il est probable que vous avez spécifié un champ d'analyse contenant la même valeur pour tous vos points ou entités surfaciques dans la couche d'analyse. La statistique utilisée par cet outil ne peut pas effectuer de résolution si les valeurs sont identiques. | Vous pouvez spécifier un champ d'analyse différent ou, pour les entités ponctuelles, des densités ponctuelles d'analyseau lieu de valeurs ponctuelles. |
Nous n'avons pas pu calculer les points chauds et froids pour les données fournies. Le cas échéant, essayez de spécifier un champ d'analyse. | Même si cela est peu probable, lorsque l’outil a créé une grille de quadrillage et comptabilisé le nombre de points à l’intérieur de chaque carré, les nombres pour tous les carrés étaient identiques. | Fournissez vos propres zones d’agrégation, dessinez ou fournissez des zones d’analyse d’emprise ou spécifiez un champ d’analyse. |
La taille de cellule doit être inférieure au canal de distance. | Vous avez indiqué une valeur de canal de distance inférieure à la taille de chaque cellule de grille. | Vérifiez les unités spécifiées pour Canal de distance et Taille de cellule, utilisez la valeur par défaut calculée par l’outil ou utilisez une valeur supérieure à la taille d’une cellule de grille. |
Vous trouverez des informations complémentaires concernant les algorithmes utilisés par l’outil Rechercher les points chauds dans la rubrique Fonctionnement de l’analyse de points chauds optimisée.
Outils semblables
L'outil Trouver des points chauds permet de déterminer si le modèle spatial de vos données présente des agrégations statistiquement significatives. D'autres outils susceptibles d'être utiles sont présentés ci-après.
Outils d'analyse Map Viewer Classic
Pour rechercher des points aberrants dans le modèle spatial de vos données, utilisez l’outil Trouver des points aberrants.
Pour créer une carte de densité de vos entités ponctuelles ou linéaires, utilisez l’outil Calculer la densité.
Outils d'analyse ArcGIS Pro
L’outil Rechercher les points chauds calcule les mêmes statistiques que les outils Analyse de points chauds (Getis-Ord Gi*) et Analyse de points chauds optimisée.
Vous avez un commentaire à formuler concernant cette rubrique ?