La herramienta Buscar clústeres de puntos identifica clústeres de entidades de puntos en el ruido colindante en función de su distribución espacial.
Ejemplos
Algunos ejemplos de uso de esta herramienta son:
- Una organización que estudia una enfermedad concreta propagada por plagas desea identificar en qué lugar de su área de estudio comenzar el tratamiento y la exterminación de estas plagas. Una analista tiene un dataset de puntos que representa las viviendas infestadas y no infestadas en el área de estudio. La analista utiliza la herramienta Buscar clústeres de puntos para buscar el clúster más grande de viviendas infestadas.
- Una organización de respuesta ante desastres debe determinar dónde debe desplegar sus recursos para el rescate y la evacuación tras un desastre natural. Un analista utiliza la herramienta Buscar clústeres de puntos para identificar clústeres de tuits geolocalizados que mencionan el evento. La organización utiliza el tamaño y la ubicación de los clústeres para representar cartográficamente el área afectada e informar a sus equipos de ayuda humanitaria.
Notas de uso
La herramienta Buscar clústeres de puntos incluye configuraciones para entidades de entrada, configuración de valores atípicos y la capa de resultados.
Entidades de entrada
El grupo Entidades de entrada incluye el parámetro Capa de entrada, que es la capa con entidades de puntos que se agrupará en clústeres en función de su distribución espacial.
El recuento de entidades se muestra debajo del nombre de la capa. El recuento incluye todas las entidades de la capa, excepto las entidades que se han eliminado mediante el uso de un filtro. La configuración del entorno, como la extensión de procesamiento, no se refleja en el recuento de entidades.
Nota:
Web Mercator no es una proyección apropiada para el análisis espacial. Si el sistema de referencia espacial de la capa de entrada es WGS 1984 Web Mercator (Auxiliary Sphere), los datos se convertirán a un sistema de coordenadas geográficas para utilizar distancias de cuerda en el análisis.
Configuración de clúster
El grupo Configuración de clúster incluye los siguientes parámetros:
- Método de clustering especifica el método que se usará para identificar clústeres.
- Distancia definida (DBSCAN): identifica clústeres buscando dentro de una distancia de búsqueda especificada. Este método es apropiado cuando todos los grupos significativos presenten densidades similares.
- Autoajuste (HDBSCAN): utiliza toda una variedad de distancias para separar clústeres de densidades variables del ruido más disperso. Este método es el que más se basa en los datos de los métodos de agrupamiento, por lo que no necesita una distancia de búsqueda.
- Escala múltiple (OPTICS): identifica clústeres utilizando la distancia entre vecinos y un diagrama de alcance. El método primero determina la distancia mínima de alcance para todos los puntos. La distancia mínima de alcance es la distancia desde un punto hasta su vecino más cercano que aún no ha sido visitado por la búsqueda. Una vez que se determina la distancia de alcance mínima para todos los puntos, la herramienta construye un diagrama de alcance. El diagrama de alcance traza el orden de alcance de cada punto y su distancia de alcance, lo que revela la estructura de agrupación de los puntos. A continuación, este método utiliza el valor Sensibilidad de clúster para identificar los clústeres. Similar al método HDBSCAN, el método OPTICS puede identificar grupos con diferentes densidades.
- Puntos mínimos por clúster es el número mínimo de puntos que se utilizarán para considerar que un agrupamiento de puntos es un clúster. En general, cuanto menor sea el valor, más clústeres se detectarán. Este valor debe ser menor o igual que el número de puntos de la capa. El valor mínimo admitido es 2.
- Distancia de búsqueda especifica la distancia máxima alrededor de cada punto que se tendrá en cuenta. Si el valor de Método de clustering es Distancia definida (DBSCAN), el valor de Distancia de búsqueda es la distancia máxima alrededor de cada entidad de punto del clúster para buscar puntos que se puedan incluir en el clúster. Si el número mínimo de puntos se puede encontrar dentro de la distancia de búsqueda de un punto en particular, ese punto se considera un punto central. Si el número mínimo de puntos no se puede encontrar dentro de la distancia de búsqueda de un punto en particular, pero ese punto está dentro de la distancia de búsqueda de un punto central, el punto se considera un punto de borde. Los clústeres estarán compuestos por puntos principales y puntos de borde. Si el valor de Método de clustering es Escala múltiple (OPTICS), la Distancia de búsqueda es la distancia máxima alrededor de cada punto para buscar puntos para asignar una distancia de alcance. La distancia de alcance es la distancia desde un punto hasta su vecino más cercano que aún no ha sido visitado por la búsqueda. A los puntos que se encuentran dentro de la distancia central de un punto se les asigna la distancia central como su distancia de alcance. La distancia central de cada punto es una medida de la distancia que es necesario recorrer desde cada punto hasta el número mínimo de entidades.
- Unidad de distancia de búsqueda representa las unidades para el valor Distancia de búsqueda.
- Campo de tiempo es el campo de la capa de entrada que contiene una marca de tiempo para cada entidad. Este parámetro está disponible si el valor Método de clustering es Distancia definida (DBSCAN) o Escala múltiple (OPTICS). Si se especifica un valor de Campo de tiempo, también debe proporcionar un valor de Distancia de búsqueda y Unidad de distancia de búsqueda.
- Intervalo de tiempo de búsqueda es el intervalo de tiempo que se utilizará para determinar si las entidades forman un clúster de espacio-tiempo. El intervalo de tiempo de búsqueda abarca desde antes y después del tiempo de cada entidad; por ejemplo, un intervalo de tiempo de búsqueda de 3 días alrededor de una entidad incluirá todas las entidades que empiecen 3 días antes y terminen 3 días después del tiempo de la entidad.
- Unidad de tiempo de búsqueda son las unidades para el Intervalo de tiempo de búsqueda.
- Sensibilidad de clúster representa cómo se utilizará la forma (tanto la pendiente como la altura) de los picos dentro del diagrama de alcance para separar los clústeres. El diagrama de alcance traza el orden de alcance de los puntos y su distancia de alcance. Un valor de Sensibilidad de clúster muy alto (cercano a 100) tratará incluso los picos más pequeños del diagrama de alcance como una separación entre clústeres. Un valor de Sensibilidad de clúster muy bajo (cercano a 0) tratará solo los picos más altos y más pronunciados del diagrama de alcance como una separación entre clústeres. Si se deja en blanco, la herramienta encontrará un valor de sensibilidad mediante la divergencia de Kullback-Leibler.
Capa de resultados
El grupo Capa de resultados incluye los siguientes parámetros:
- El Nombre de salida determina el nombre de la capa que se crea y se agrega al mapa. El nombre debe ser único. Si ya existe una capa con el mismo nombre en su organización, la herramienta fallará y se le pedirá que utilice otro nombre.
- Guardar en carpeta especifica el nombre de una carpeta de Mi contenido en la que se guardará el resultado.
Entornos
La configuración del entorno de análisis cuenta con parámetros adicionales que afectan a los resultados de una herramienta. Puede acceder a la configuración del entorno de análisis de la herramienta desde el grupo de parámetros Configuración del entorno.
Esta herramienta respeta estos entornos de análisis:
- Sistema de coordenadas de salida
- Extensión de procesamiento
Nota:
La extensión de procesamiento predeterminada en Visor de mapas es la extensión completa. Este valor predeterminado es diferente de Map Viewer Classic, en donde Usar extensión de mapa actual está habilitado de forma predeterminada.
Salidas
La herramienta genera una capa de puntos. Si el valor del parámetro Método de clustering es Autoajuste (HDBSCAN) o Escala múltiple (OPTICS), la herramienta también generará un gráfico. La capa de salida de todas las opciones de Método de clustering incluirá los campos Cluster ID, Source ID y Color ID. El campo Cluster ID identifica el clúster al que pertenece cada punto. Los puntos de ruido tendrán un valor de -1. El valor del campo Source ID es un identificador único. El valor del campo Color ID representa el color asignado a un punto y su clúster. Si la capa de salida incluye más de nueve clústeres, se asignarán varios clústeres a cada color. Sin embargo, a los clústeres vecinos se les asignarán colores diferentes para que se puedan diferenciar visualmente. Si el valor del parámetro Método de clustering es Autoajuste (HDBSCAN), la capa de puntos de salida contendrá los siguientes campos adicionales:
- Probability es un valor entre 0 y 1 que denota la probabilidad de que un punto pertenezca a su clúster asignado. Los puntos de ruido tendrán un valor de 0.
- Outlier es un valor entre 0 y 1 que indica si un punto puede ser un valor atípico dentro de su propio clúster. Los puntos de ruido se considerarán un clúster único. Un valor alto indica que es más probable que el punto sea un valor atípico.
- Exemplar es un valor entre 0 y 1 que indica si un punto es el más representativo de su clúster.
- Stability es un valor que refleja la persistencia de cada clúster en un rango de escalas. Un valor mayor indica que el clúster persiste en un amplio rango de escalas de distancia.
Si el valor del parámetro Método de clustering es Escala múltiple (OPTICS), la capa de salida incluirá los siguientes campos adicionales:
- Reachability order es cómo se ordenaron las entidades de entrada para el análisis
- Reachability distance es la distancia entre cada punto y su vecino no visitado más cercano.
Si el valor del parámetro Método de clustering es Autoajuste (HDBSCAN) o Escala múltiple (OPTICS), la herramienta generará un gráfico. Escala múltiple (OPTICS) genera un diagrama de alcanzabilidad que puede utilizarse para evaluar la densidad de cada clúster. Autoajuste (HDBSCAN) genera un gráfico de distribución de probabilidad de pertenencia, que muestra la distribución de la probabilidad de que una entidad pertenezca a su clúster asignado. Para ver el gráfico, haga clic en Gráficos en la barra de herramientas Contenido.
Si se especifica un valor de Campo de tiempo, la salida incluirá un gráfico Intervalo de tiempo por clúster que mostrará el intervalo de tiempo de cada clúster de espacio-tiempo. Para ver el gráfico, haga clic en Gráficos en la barra de herramientas Contenido. La capa de salida también incluirá los siguientes campos que resumen el intervalo de tiempo del clúster al que pertenece cada punto:
- Hora de inicio es la hora de inicio del clúster al que pertenece la entidad.
- Hora de finalización es la hora de finalización del clúster al que pertenece la entidad.
- Tiempo medio es el tiempo medio del clúster al que pertenece la entidad.
- Exageración de tiempo
Puede ver detalles adicionales sobre el análisis en la página de elementos de la capa de salida. Para acceder a la página de elementos de la capa, haga clic en Análisis en la barra de herramientas Configuración. Haga clic en Historial y busque y haga clic en la ejecución de herramienta correcta. Para ejecuciones de herramientas correctas, los detalles del análisis se abrirán en la pestaña Resultados. Haga clic en el botón de opciones junto a la capa de salida y en Ver detalles.
Requisitos de licencia
Esta herramienta requiere las siguientes licencias y configuraciones:
- Tipo de usuario Creator o GIS Professional
- Rol de publicador o administrador, o rol personalizado equivalente
Recursos
Utilice los recursos siguientes para más información:
- Clustering basado en densidad en ArcGIS Pro
- Buscar clústeres de puntos en API REST de ArcGIS
- find_point_clusters en ArcGIS API for Python