Configurar nodos habilitados con GPU

Kubernetes incluye soporte para gestionar unidades de procesamiento gráfico (GPU) en diferentes nodos de un clúster utilizando plugins de dispositivos.

En ArcGIS Enterprise on Kubernetes, puede implementar un plugin de dispositivos para habilitar nodos GPU en un clúster para optimizar flujos de trabajo de SIG, como los del análisis de ráster y el aprendizaje profundo. Capacidades como el análisis de ráster se configuran de forma predeterminada para funcionar en el modo de CPU, pero también ofrecen la flexibilidad de funcionar en el modo de GPU cuando estos recursos están disponibles. Considere si sus cargas de trabajo se beneficiarán del uso de nodos habilitados para GPU, ya que este tipo de nodos suelen ser más caros.

Asegúrese de disponer de suficientes recursos de GPU para todas sus cargas de trabajo habilitadas para GPU. Por ejemplo, un único pod de análisis rasterizado consumirá 1 GPU. Para admitir 10 réplicas de estos pods, necesitará 10 GPU disponibles en sus nodos habilitados para GPU.

Habilitar GPU

Para habilitar el uso de la GPU para cargas de trabajo, complete los siguientes pasos:

  1. Verifique que su instancia tiene el plugin de dispositivo NVIDIA instalado para Kubernetes.

    El plugin de dispositivo NVIDIA para Kubernetes es un daemonset que permite exponer el número de GPU de cada nodo de un clúster, ejecutar contenedores habilitados con GPU y hacer un seguimiento del estado de las GPU. Muchos entornos de la nube se han preconfigurado con nodos GPU. Si el plugin de dispositivo no está instalado, consulte los detalles y los pasos de instalación en la documentación del plugin de dispositivo NVIDIA para Kubernetes. Si ha implementado localmente, su administrador debe habilitar la GPU en cada nodo de cada clúster.

    Nota:

    En esta versión, ArcGIS Enterprise on Kubernetes solo es compatible con GPU NVIDIA.

  2. Si lo desea, cree una etiqueta personalizada para sus nodos GPU.

    Se recomienda etiquetar los nodos GPU para permitir que las cargas de trabajo se programen en estos nodos utilizando reglas de ubicación de pods. Utilice el siguiente comando para etiquetar cada nodo:

    kubectl label nodes <your-node-name> <your-key>=<your-value>
    

  3. Configure los servicios para utilizar la GPU.

    Si está habilitando la GPU para los servicios de notebook, consulte Ver y editar tiempos de ejecución para obtener información sobre cómo configurar las unidades de GPU por nodo. Si va a habilitar la GPU para el análisis ráster, consulte Habilitar recursos de GPU para análisis de ráster.

  4. Si lo desea, utilice marcas para garantizar que solo las cargas de trabajo que requieren GPU se programen en nodos habilitados para GPU.

    Aplique tolerancias a cualquier carga de trabajo que deba ejecutarse en nodos habilitados para GPU antes de marcar los nodos. Utilice el siguiente comando para marcar un nodo GPU:

    kubectl taint nodes <your-node-name> nvidia.com/gpu=Exists:NoExecute
    


En este tema
  1. Habilitar GPU