Инструмент Найти кластеры точек определяет среди точечных объектов кластеры в окружающем шуме на основе их пространственного распределения.
Примеры
Вот примеры применения этого инструмента:
- Организация, которая изучает конкретное заболевание, переносимое вредителями, хочет определить, где в их исследуемой области следует начать лечение и уничтожение этих вредителей. У аналитика есть точечный набор данных, который представляет зараженные и незараженные домохозяйства в исследуемой области. Аналитик использует инструмент Найти кластеры точек, чтобы определить самые большие кластеры зараженных домохозяйств.
- Организация по реагированию на стихийные бедствия должна определить, где разместить свои ресурсы для спасения и эвакуации после стихийного бедствия. Аналитик использует инструмент Найти кластеры точек для определения кластеров твитов с геолокацией, в которых упоминается событие. Организация использует размер и местоположение кластеров для составления карты пострадавшего района и информирования о своих усилиях по оказанию помощи.
Примечания по использованию
Инструмент Найти кластеры точек содержит настройки для входных объектов, параметров кластеров и слоя результатов.
Входные объекты
Группа Входные объекты включает параметр Входной слой, который представляет собой слой с точечными объектами, которые будут сгруппированы в кластеры на основе их пространственного распределения.
Примечание:
Web Mercator - не подходящая для пространственного анализа проекция. Если система пространственная системой привязки входного слоя — WGS 1984 Web Mercator (Auxiliary Sphere), данные будут преобразованы в географическую систему координат, чтобы использовать в анализе хордовые расстояния.
Настройки кластера
Группа Параметры кластера включает следующие параметры:
- Метод кластеризации определяет метод, который будет использоваться для идентификации кластеров.
- Заданное расстояние (DBSCAN) — идентифицирует кластеры путем поиска в пределах заданного расстояния. Этот метод подходит, когда все значимые кластеры имеют сходную плотность.
- Автонастройка (HDBSCAN) — Использует различные расстояния для отделения кластеров с различными плотностями от окружающего шума. Этот метод кластеризации является наиболее ориентированным на данные, поэтому для него не требуется расстояние поиска.
- Многомасштабный (OPTICS) — идентифицирует кластеры, используя расстояние между соседями и график достижимости. Метод сначала определяет минимальное расстояние достижимости для всех точек. Минимальное расстояние достижимости — это расстояние от точки до ее ближайшего соседа, который еще не был посещен в ходе поиска. После определения минимального расстояния достижимости для всех точек, инструмент строит график достижимости. График достижимости отображает порядок достижимости каждой точки и расстояние ее достижимости, раскрывая структуру кластеризации точек. Затем этот метод использует значение Чувствительность кластера для идентификации кластеров. Подобно методу DBSCAN, метод OPTICS позволяет идентифицировать кластеры с различной плотностью.
- Минимальное число точек на кластер — это минимальное количество точек, используемое для рассмотрения группировки точек как кластера. В целом, чем меньше значение, тем больше кластеров будет обнаружено. Это значение должно быть меньше или равно количеству точек на слое. Минимальное поддерживаемое значение — 2
- Расстояние поиска задает максимальное расстояние вокруг каждой точки, которая будет учитываться. Если значением Метода кластеризации является Заданное расстояние (DBSCAN), то значение Расстояние поиска — это максимальное расстояние вокруг каждого точечного объекта в кластере для поиска точек, которые могут быть включены в кластер. Если минимальное количество точек может быть найдено в пределах расстояния поиска от определенной точки, эта точка считается базовой точкой. Если минимальное количество точек не может быть найдено в пределах расстояния поиска от определенной точки, но эта точка находится в пределах расстояния поиска от базовой точки, эта точка считается граничной. Кластеры состоят из базовых и граничных точек. Если значением Метода кластеризации является Многомасштабный (OPTICS), то значение Расстояние поиска — это максимальное расстояние вокруг каждой точки при поиске точек для назначения расстояния достижимости. Расстояние достижимости — это расстояние от точки до ее ближайшего соседа, который еще не был посещен в ходе поиска. Точкам, находящимся в пределах кластерного расстояния от точки, это кластерное расстояние присваивается в качестве расстояния их достижимости. Кластерное расстояние для точки — это дистанция, необходимая для перемещения от каждой точки до заданного минимального числа объектов.
- Единица измерения расстояния поиска — это единицы измерения значения Расстояние поиска.
- Чувствительность кластера определяет то, как форма пиков (и уклон, и высота) на графике достижимости будет использоваться для разделения кластеров. График достижимости отображает порядок достижимости точек и расстояние их достижимости. Очень высокое значение Чувствительности кластера (близкое к 100) приведет к рассмотрению даже самых маленьких пиков на графике достижимости в качестве границ между кластерами. Очень низкое значение Чувствительности кластера (близкое к 0) приведет к рассмотрению только наиболее крутых и высоких пиков на графике достижимости в качестве разделений между кластерами. Если оставить поле пустым, инструмент найдет значение чувствительности посредством Дивергенции Кулбака-Лейблера.
Слой результата
Группа Слой результата включает в себя следующие параметры:
- Выходное имя определяет имя слоя, который создается и добавляется на карту. Имя должно быть уникальным. Если слой с таким же именем уже существует в вашей организации, инструмент завершится ошибкой, и вам будет предложено указать другое имя.
- Сохранить в папке — указывает имя папки в Моих ресурсах, в которой будет сохранен результат.
Параметры среды
Настройки среды анализа — это дополнительные параметры, которые влияют на результаты работы инструмента. Вы можете получить доступ к настройкам среды анализа инструмента из группы параметров Настройки среды.
Этот инструмент поддерживает следующие параметры среды анализа:
- Выходная система координат
- Экстент обработки
Примечание:
Экстент обработки по умолчанию в Map Viewer - это Полный экстент. Это значение по умолчанию отличается от Map Viewer Classic, в котором по умолчанию включен параметр Использовать текущий экстент карты.
Выходные данные
Инструмент создает точечный слой. Если значение параметра Метод кластеризации - Автонастройка (HDBSCAN) или Мультимасштабный» (OPTICS), инструмент также выведет диаграмму. Выходной слой всех опций Метода кластеризации будет включать поля Cluster ID, Source ID и Color ID. Поле Cluster ID указывает кластер, к которому принадлежит каждая точка. Точки шума будут иметь значение -1. Значение поля Source ID является уникальным идентификатором. Значение поля Color ID представляет цвет, присвоенный точке и ее кластеру. Если выходной слой включает более девяти кластеров, каждому цвету будет присвоено несколько кластеров. Однако соседним кластерам будут присвоены разные цвета, чтобы они визуально отличались друг от друга. Если значением параметра Метод кластеризации является Автонастройка (HDBSCAN), выходной точечный слой будет содержать следующие дополнительные поля:
- Probability это значение от 0 до 1, которое обозначает вероятность того, что точка принадлежит к назначенному ей кластеру. Точки шума будут иметь значение 0.
- Outlier это значение между 0 и 1, которое обозначает, может ли точка быть выбросом в своем собственном кластере. Точки шума будут рассматриваться как единый кластер. Более высокое значение означает большую вероятность, что точка является выбросом.
- Exemplar это значение от 0 до 1, которое показывает, является ли точка наиболее репрезентативной для своего кластера.
- Stability это значение, которое отражает постоянство каждого кластера в различных масштабах. Большее значение указывает на то, что кластер сохраняется в более широком диапазоне масштабов расстояний.
Если значением параметра Метод кластеризации является Многомасштабный (OPTICS), выходной слой будет включать следующие дополнительные поля:
- Reachability order это то, как были упорядочены входные объекты для анализа
- Reachability distance это расстояние между каждой точкой и ее ближайшим непосещенным соседом.
Если значение параметра Метод кластеризации - Автонастройка (HDBSCAN) или Мультимасштабный (OPTICS), инструмент выведет диаграмму. Мультимасштабный (OPTICS) выводит график достижимости, который можно использовать для оценки плотности каждого кластера. Автонастройка (HDBSCAN) выводит диаграмму распределения вероятности членства, которая отображает распределение вероятности того, что объект принадлежит назначенному ему кластеру. Чтобы просмотреть диаграмму, щелкните Диаграммы на панели Содержание.
Вы можете просмотреть дополнительные сведения об анализе на странице элемента выходного слоя. Чтобы получить доступ к странице элемента слоя, щелкните Анализ на панели инструментов Настройки. Нажмите История, найдите и щелкните успешный запуск инструмента. Детали анализа откроются на вкладке Результаты. Щелкните кнопку опций рядом с выходным слоем и нажмите Открыть описание элемента.
Лицензионные требования
Для этого инструмента требуются следующие лицензии и конфигурации:
- Тип пользователя Creator или GIS Professional
- Роль Издатель или Администратор или эквивалентная пользовательская роль
Ресурсы
Для дополнительной информации см. следующие ссылки:
- Кластеризация на основе плотности в ArcGIS Pro
- Поиск кластеров точек в ArcGIS REST API
- find_point_clusters в ArcGIS API for Python