Настройка узлов с поддержкой графического процессора

Kubernetes включает поддержку управления графическими процессорами (GPU) на различных узлах кластера с помощью подключаемых модулей устройств.

В ArcGIS Enterprise on Kubernetes можно внедрить подключаемый модуль устройства для включения графических узлов в кластер, чтобы оптимизировать рабочие процессы ГИС, например, связанные с аналитикой растров и глубоким обучением. По умолчанию такие возможности, как аналитика растра, настроены для запуска в режиме центрального процессора (CPU), но также обеспечивают гибкость для запуска в режиме графического процессора (GPU), когда эти ресурсы доступны. Подумайте, выиграют ли ваши рабочие нагрузки от использования узлов с поддержкой графического процессора, поскольку эти типы узлов, как правило, дороже в использовании.

Убедитесь, что у вас достаточно ресурсов графического процессора для всех рабочих нагрузок с поддержкой графического процессора. Например, один модуль растровой аналитики будет использовать 1 графический процессор. Для поддержки 10 реплик этих модулей вам понадобится 10 графических процессоров, доступных на всех узлах с поддержкой графических процессоров.

Включить графический процессор

Чтобы включить использование графических процессоров для рабочих нагрузок, выполните следующие шаги:

  1. Убедитесь, что в вашем экземпляре установлен плагин устройства NVIDIA для Kubernetes.

    Подключаемый модуль устройства NVIDIA для Kubernetes представляет собой набор демонов, который позволяет отображать число графических процессоров на каждом узле кластера, запускать контейнеры с поддержкой графических процессоров и отслеживать работоспособность графических процессоров. Многие облачные среды предварительно настроены с узлами графического процессора. Если подключаемый модуль устройства не установлен, см. документацию Подключаемый модуль устройств NVIDIA для Kubernetes для получения подробной информации и инструкций по установке. Если выполняется локальное развертывание, администратор должен включить графический процессор на каждом узле кластера.

    Примечание:

    В данной версии ArcGIS Enterprise on Kubernetes поддерживается только с графическими процессорами NVIDIA.

  2. Дополнительно создайте пользовательскую надпись для ваших узлов с графическими процессорами.

    Рекомендуется помечать узлы с графическими процессорами, чтобы рабочие нагрузки были запланированы на эти узлы с использованием правил размещения модулей. Используйте следующую команду для маркировки каждого узла:

    kubectl label nodes <your-node-name> <your-key>=<your-value>
    

  3. Настройка сервисов для использования графического процессора.

    Если вы включаете графический процессор для сервисов блокнотов ноутбуков, информацию о настройке блоков графического процессора для каждого узла см. в разделе Просмотр и редкатирование сред выполнения. Если вы используете графический процессор для растровой аналитики, см. раздел Включение ресурсов GPU для растровой аналитики.

  4. Дополнительно используйте запреты, чтобы гарантировать, что только рабочие нагрузки, требующие графического процессора, запланированы на узлы с поддержкой GPU.

    Применяйте допуски к любым рабочим нагрузкам, которые должны выполняться на узлах с поддержкой GPU, прежде чем запрещать узлы. Используйте следующую команду для запрета узла с графическим процессором:

    kubectl taint nodes <your-node-name> nvidia.com/gpu=Exists:NoExecute