Kubernetes включает поддержку управления графическими процессорами (GPU) на различных узлах кластера с помощью подключаемых модулей устройств.
В ArcGIS Enterprise on Kubernetes можно внедрить подключаемый модуль устройства для включения графических узлов в кластер, чтобы оптимизировать рабочие процессы ГИС, например, связанные с аналитикой растров и глубоким обучением. По умолчанию такие возможности, как аналитика растра, настроены для запуска в режиме центрального процессора (CPU), но также обеспечивают гибкость для запуска в режиме графического процессора, когда эти ресурсы доступны.
Учет доступности и использования графического процессора в кластере не является обязательным действием, поскольку это повлечет за собой дополнительные расходы.
Чтобы включить графический процессор, требуется подключаемый модуль устройств NVIDIA для Kubernetes. Подключаемый модуль устройства NVIDIA для Kubernetes представляет собой набор демонов, который позволяет отображать число графических процессоров на каждом узле кластера, запускать контейнеры с поддержкой графических процессоров и отслеживать работоспособность графических процессоров.
Примечание:
В данной версии ArcGIS Enterprise on Kubernetes поддерживается только с графическими процессорами NVIDIA.
Включить графический процессор
Чтобы включить графический процессор для вашей организации, выполните следующие шаги, которые зависят от вашей среды и настроек:
- Выполните действия по настройке аналитики растров, сервисов блокнотов или другой возможности, для которой вы хотите использовать узлы с поддержкой графического процессора.
- Проверьте, установлен ли на вашем экземпляре подключаемый модуль устройства.
Многие облачные среды предварительно настроены с узлами графического процессора. Если подключаемый модуль устройства не установлен, см. документацию Подключаемый модуль устройств NVIDIA для Kubernetes для получения подробной информации и инструкций по установке. Если выполняется локальное развертывание, администратор должен включить графический процессор на каждом узле кластера.
- Чтобы использовать узлы с поддержкой графического процессора для рабочих процессов ГИС в вашей организации, настройте доступ к ресурсам графического процессора.
- Дополнительно, если хотите запускать рабочие нагрузки графического процессора исключительно на узлах графического процессора, настройте привязку узлов и допуски.
Настройка доступа к ресурсам графического процессора
Если вы включаете графический процессор для сервисов блокнотов ноутбуков, информацию о настройке блоков графического процессора для каждого узла см. в разделе Просмотр и редкатирование сред выполнения.
Если вы включаете графический процессор для растровой аналитики, выполните следующие действия, чтобы использовать ArcGIS Enterprise Administrator API Directory для настройки запросов и ограничений на графический процессор для каждого из следующих развертываний:
- system-rasteranalysistools-gpsyncserver (используется для обучающих моделей)
- system-rasterprocessinggpu-dpserver (используется для обработки)
- Войдите в ArcGIS Enterprise Administrator API Directory как администратор.
- Щелкните Системы > Развертывания.
- Найдите развертывание system-rasteranalysistools-gpsyncserver и щелкните соответствующий ID.
- Щелкните Изменить развертывание.
- В развертывании JSON найдите раздел resources, для развертывания и параметр customResources.
"containers": [ { "name": "main-container", "resources": { "memoryMin": "4Gi", "memoryMax": "8Gi", "cpuMin": "0.125", "customResources": { "limits":{"nvidia.com/gpu": "1"}, "requests":{"nvidia.com/gpu": "1"} }, "cpuMax": "2" },
- Обновите параметр customResources для каждого перечисленного контейнера, чтобы включить запросы и ограничения для графического процессора.
- Щелкните Подтвердить, чтобы сохранить изменения в развертывании.
- Повторите шаги для развертывания system-rasterprocessinggpu-dpserver.
Более подробно о том, как редактировать развертывания системы в документации Administrator Directory API.
Настройка привязки узлов и допусков
На узлах графического процессора могут выполняться рабочие нагрузки как центрального процессора, так и графического процессора. Если вашим рабочим нагрузкам центрального процессора разрешено запускаться на узле графического процессора, никаких дальнейших действий не требуется. Однако, чтобы обеспечить запуск рабочих нагрузок графического процессора исключительно на узлах GPU, администратор должен предпринять дополнительные шаги для настройки привязки узлов и допусков. Выполните следующие шаги, чтобы пометить узлы и применить допуски к применимым сервисам, чтобы их можно было запланировать на помеченном узле:
- Чтобы рабочие нагрузки графического процессора планировались исключительно на узлах графического процессора, пометьте узлы графического процессора.
kubectl taint nodes <your-node-name> nvidia.com/gpu=Exists:NoExecute
- Отметка узла графического процессора. В качестве альтернативы можно использовать существующую отметку, которая уже указана в узле.
Чтобы подписать узлы ключом raster и значением GPU для растровой аналитики, используйте следующую команду:
kubectl label nodes <your-node-name> raster=GPU
Чтобы подписать узлы ключом notebook и значением NotebooksGPUNode для сервисов блокнотов, используйте следующую команду:
kubectl label nodes <your-node-name> notebook=NotebooksGPUNode
- Войдите в ArcGIS Enterprise Manager как администратор.
- Откройте настройки размещения модуля.
Если вы включаете графический процессор для сервисов блокнотов, информацию о доступе к настройкам размещения модулей см. в разделе Просмотр и редактирование сред выполнения.
Чтобы открыть настройки размещения модуля для анализа растров, выполните следующие действия:
- Щелкните кнопку Сервисы на боковой панели.
- Щелкните Системные сервисы и выберите сервис RasterProcessingGPU.
- Щелкните вкладку Размещение модуля.
- Чтобы применить правило привязки узлов, которое гарантирует, что модули сервиса запланированы на узлах GPU, укажите следующую информацию в разделе Привязка узлов и щелкните Добавить:
- Тип — Обязательное
- Ключ — укажите ключ, используемый для подписывания узла GPU, например raster.
- Оператор — In
- Значение — укажите значение, используемое для подписывания узла GPU, например GPU.
- Чтобы применить допуск, позволяющий модулям работать узлах, которые вы собираетесь запретить, укажите следующую информацию в разделе Допуски и щелкните Добавить:
- Эффект — не выполнять
- Ключ — nvidia.com/gpu
- Оператор — существует
- Щелкните Сохранить.
- Убедитесь, что модули графического процессора запущены на узлах графического процессора.
Вы можете начать использовать ресурсы графического процессора для своих рабочих нагрузок. Дополнительно см. рекомендации по настройке аналитики растров.