Найти кластеры точек (Map Viewer)

Инструмент Найти кластеры точек определяет среди точечных объектов кластеры в окружающем шуме на основе их пространственного распределения.

Примеры

Вот примеры применения этого инструмента:

  • Организация, которая изучает конкретное заболевание, переносимое вредителями, хочет определить, где в их исследуемой области следует начать лечение и уничтожение этих вредителей. У аналитика есть точечный набор данных, который представляет зараженные и незараженные домохозяйства в исследуемой области. Аналитик использует инструмент Найти кластеры точек, чтобы определить самые большие кластеры зараженных домохозяйств.
  • Организация по реагированию на стихийные бедствия должна определить, где разместить свои ресурсы для спасения и эвакуации после стихийного бедствия. Аналитик использует инструмент Найти кластеры точек для определения кластеров твитов с геолокацией, в которых упоминается событие. Организация использует размер и местоположение кластеров для составления карты пострадавшего района и информирования о своих усилиях по оказанию помощи.

Примечания по использованию

Инструмент Найти кластеры точек содержит настройки для входных объектов, параметров кластеров и слоя результатов.

Входные объекты

Группа Входные объекты включает параметр Входной слой, который представляет собой слой с точечными объектами, которые будут сгруппированы в кластеры на основе их пространственного распределения.

Количество объектов отображается под именем слоя. Количество включает все объекты в слое, за исключением объектов, которые были удалены с помощью фильтра. Параметры среды, такие как Экстент обработки, не отражаются на количестве объектов.

Примечание:

Web Mercator - не подходящая для пространственного анализа проекция. Если система пространственная привязки входного слоя — WGS 1984 Web Mercator (Auxiliary Sphere), данные будут преобразованы в географическую систему координат, чтобы использовать в анализе хордовые расстояния.

Настройки кластера

Группа Параметры кластера включает следующие параметры:

  • Метод кластеризации определяет метод, который будет использоваться для идентификации кластеров.
    • Заданное расстояние (DBSCAN) — идентифицирует кластеры путем поиска в пределах заданного расстояния. Этот метод подходит, когда все значимые кластеры имеют сходную плотность.
    • Автонастройка (HDBSCAN) — Использует различные расстояния для отделения кластеров с различными плотностями от окружающего шума. Этот метод кластеризации является наиболее ориентированным на данные, поэтому для него не требуется расстояние поиска.
    • Многомасштабный (OPTICS) — идентифицирует кластеры, используя расстояние между соседями и график достижимости. Метод сначала определяет минимальное расстояние достижимости для всех точек. Минимальное расстояние достижимости — это расстояние от точки до ее ближайшего соседа, который еще не был посещен в ходе поиска. После определения минимального расстояния достижимости для всех точек, инструмент строит график достижимости. График достижимости отображает порядок достижимости каждой точки и расстояние ее достижимости, раскрывая структуру кластеризации точек. Затем этот метод использует значение Чувствительность кластера для идентификации кластеров. Подобно методу DBSCAN, метод OPTICS позволяет идентифицировать кластеры с различной плотностью.
  • Минимальное число точек на кластер — это минимальное количество точек, используемое для рассмотрения группировки точек как кластера. В целом, чем меньше значение, тем больше кластеров будет обнаружено. Это значение должно быть меньше или равно количеству точек на слое. Минимальное поддерживаемое значение — 2
  • Расстояние поиска задает максимальное расстояние вокруг каждой точки, которая будет учитываться. Если значением Метода кластеризации является Заданное расстояние (DBSCAN), то значение Расстояние поиска — это максимальное расстояние вокруг каждого точечного объекта в кластере для поиска точек, которые могут быть включены в кластер. Если минимальное количество точек может быть найдено в пределах расстояния поиска от определенной точки, эта точка считается базовой точкой. Если минимальное количество точек не может быть найдено в пределах расстояния поиска от определенной точки, но эта точка находится в пределах расстояния поиска от базовой точки, эта точка считается граничной. Кластеры состоят из базовых и граничных точек. Если значением Метода кластеризации является Многомасштабный (OPTICS), то значение Расстояние поиска — это максимальное расстояние вокруг каждой точки при поиске точек для назначения расстояния достижимости. Расстояние достижимости — это расстояние от точки до ее ближайшего соседа, который еще не был посещен в ходе поиска. Точкам, находящимся в пределах кластерного расстояния от точки, это кластерное расстояние присваивается в качестве расстояния их достижимости. Кластерное расстояние для точки — это дистанция, необходимая для перемещения от каждой точки до заданного минимального числа объектов.
  • Единица измерения расстояния поиска — это единицы измерения значения Расстояние поиска.
  • Поле времени – это поле входного слоя, содержащее временную метку для каждого объекта. Этот параметр доступен, если значение Метода кластеризации указано как Заданное расстояние (DBSCAN) или Мультимасштабный (Optics). Если указано значение Поле времени, вы также должны задать значения Расстояние поиска и Единицы измерения расстояния поиска.
  • Интервал времени поиска — это временной интервал, который будет использоваться для определения того, образуют ли объекты пространственно-временной кластер. Интервал времени поиска охватывает время до и после каждого объекта; например, временной интервал поиска в 3 дня вокруг объекта будет включать в себя все объекты, начинающиеся за 3 дня до и заканчивающиеся через 3 дня после объекта.
  • Единицы измерения времени поиска - это параметр для Интервала времени поиска.
  • Чувствительность кластера определяет то, как форма пиков (и уклон, и высота) на графике достижимости будет использоваться для разделения кластеров. График достижимости отображает порядок достижимости точек и расстояние их достижимости. Очень высокое значение Чувствительности кластера (близкое к 100) приведет к рассмотрению даже самых маленьких пиков на графике достижимости в качестве границ между кластерами. Очень низкое значение Чувствительности кластера (близкое к 0) приведет к рассмотрению только наиболее крутых и высоких пиков на графике достижимости в качестве разделений между кластерами. Если оставить поле пустым, инструмент найдет значение чувствительности посредством Дивергенции Кулбака-Лейблера.

Слой результата

Группа Слой результата включает в себя следующие параметры:

  • Выходное имя определяет имя слоя, который создается и добавляется на карту. Имя должно быть уникальным. Если слой с таким же именем уже существует в вашей организации, инструмент завершится ошибкой, и вам будет предложено указать другое имя.
  • Сохранить в папке — указывает имя папки в Мои ресурсы, в которой будет сохранен результат.

Параметры среды

Настройки среды анализа — это дополнительные параметры, которые влияют на результаты работы инструмента. Вы можете получить доступ к настройкам среды анализа инструмента из группы параметров Настройки среды.

Этот инструмент поддерживает следующие параметры среды анализа:

  • Выходная система координат
  • Экстент обработки
    Примечание:

    Экстент обработки по умолчанию в Map Viewer - это Полный экстент. Это значение по умолчанию отличается от Map Viewer Classic, в котором по умолчанию включен параметр Использовать текущий экстент карты.

Выходные данные

Инструмент создает точечный слой. Если значение параметра Метод кластеризации - Автонастройка (HDBSCAN) или Мультимасштабный» (OPTICS), инструмент также выведет диаграмму. Выходной слой всех опций Метода кластеризации будет включать поля Cluster ID, Source ID и Color ID. Поле Cluster ID указывает кластер, к которому принадлежит каждая точка. Точки шума будут иметь значение -1. Значение поля Source ID является уникальным идентификатором. Значение поля Color ID представляет цвет, присвоенный точке и ее кластеру. Если выходной слой включает более девяти кластеров, каждому цвету будет присвоено несколько кластеров. Однако соседним кластерам будут присвоены разные цвета, чтобы они визуально отличались друг от друга. Если значением параметра Метод кластеризации является Автонастройка (HDBSCAN), выходной точечный слой будет содержать следующие дополнительные поля:

  • Probability это значение от 0 до 1, которое обозначает вероятность того, что точка принадлежит к назначенному ей кластеру. Точки шума будут иметь значение 0.
  • Outlier это значение между 0 и 1, которое обозначает, может ли точка быть выбросом в своем собственном кластере. Точки шума будут рассматриваться как единый кластер. Более высокое значение означает большую вероятность, что точка является выбросом.
  • Exemplar это значение от 0 до 1, которое показывает, является ли точка наиболее репрезентативной для своего кластера.
  • Stability это значение, которое отражает постоянство каждого кластера в различных масштабах. Большее значение указывает на то, что кластер сохраняется в более широком диапазоне масштабов расстояний.

Если значением параметра Метод кластеризации является Многомасштабный (OPTICS), выходной слой будет включать следующие дополнительные поля:

  • Reachability order это то, как были упорядочены входные объекты для анализа
  • Reachability distance это расстояние между каждой точкой и ее ближайшим непосещенным соседом.

Если значение параметра Метод кластеризации - Автонастройка (HDBSCAN) или Мультимасштабный (OPTICS), инструмент выведет диаграмму. Мультимасштабный (OPTICS) выводит график достижимости, который можно использовать для оценки плотности каждого кластера. Автонастройка (HDBSCAN) выводит диаграмму распределения вероятности членства, которая отображает распределение вероятности того, что объект принадлежит назначенному ему кластеру. Чтобы просмотреть диаграмму, щелкните Диаграммы на панели Содержание.

Если указано значение Поля времени, выходные данные будут включать график Временного интервала для каждого кластера, отображающую временной интервал каждого пространственно-временного кластера. Чтобы просмотреть диаграмму, щелкните Диаграммы на панели Содержание. Выходной слой также будет включать следующие поля, которые суммируют временной интервал кластера, которому принадлежит каждая точка:

  • Время начала - это время начала кластера, которому принадлежит объект.
  • Время окончания - это время окончания кластера, которому принадлежит объект.
  • Среднее время - это среднее время, которому принадлежит кластер.
  • Преувеличение времени
Вы можете использовать эти поля для визуализации пространственно-временных кластеров во времени, включив время на слое, а затем используя бегунок времени в Map Viewer. Чтобы включить время для слоя, щелкните Слои на панели инструментов Содержание. Щелкните слой. На панели инструментов Настройки щелкните Свойства. Разверните ниспадающее меню Информация. Щелкните слой в разделе Источник слоя. Тогда откроется страница элемента слоя. На вкладке Обзор щелкните значок Редактировать в Настройках времени. Появится окно Настройки времени. Отметьте пункт Включить время. Выберите определенные события во времени затем Среднее время в качестве Поля времени.

Вы можете просмотреть дополнительные сведения об анализе на странице элемента выходного слоя. Чтобы получить доступ к странице элемента слоя, щелкните Анализ Анализ на панели инструментов Настройки. Нажмите История, найдите и щелкните успешный запуск инструмента. Детали анализа откроются на вкладке Результаты. Щелкните кнопку опций рядом с выходным слоем и нажмите Просмотр подробной информации.

Лицензионные требования

Для этого инструмента требуются следующие лицензии и конфигурации:

  • Тип пользователя Creator или GIS Professional
  • Роль Издатель или Администратор или эквивалентная пользовательская роль

Ресурсы

Для дополнительной информации см. следующие ссылки: