Consideraciones para el uso de un almacén relacional en la nube

El almacenamiento del sistema es un requisito fundamental de ArcGIS Enterprise para admitir flujos de trabajo administrativos y de otro tipo en la organización. En este requisito de almacenamiento se incluyen dos data stores relacionales que admiten datos de entidades alojados y aspectos administrativos tales como los ajustes de configuración y personalización.

Un administrador puede configurar volúmenes persistentes para admitir los almacenes relacionales o, alternativamente, puede configurar el almacén relacional fuera del clúster utilizando un servicio de base de datos en la nube compatible. Esta opción puede ser la mejor para administradores con experiencia en la administración de bases de datos de PostgreSQL, ya que puede proporcionar ventajas de fiabilidad, escalado y rendimiento cuando se utilizan servicios en la nube de Amazon Web Services (AWS), Microsoft Azure y Google Cloud.

Como ocurre con todas las ofertas de servicios, los proveedores de servicios de bases de datos en la nube pueden cambiar la configuración y la funcionalidad de sus ofertas, incluso en versiones menores. Es posible que los cambios realizados por el proveedor puedan afectar negativamente al acceso desde ArcGIS a la base de datos. Para mitigar estos efectos adversos, se recomienda que trabaje con su proveedor de servicios en la nube para comprender cualquier cambio en su servicio y mantener actualizado su software ArcGIS con el fin de tener acceso a las últimas actualizaciones que abordan los cambios en los servicios en la nube. Realice copias de seguridad periódicas de su organización de ArcGIS Enterprise y pruebe el proceso de restauración de las copias de seguridad.

A continuación se ofrecen algunas consideraciones sobre el uso de un almacén relacional en la nube con ArcGIS Enterprise, como el uso del software, los tipos admitidos, los requisitos y las necesidades de mantenimiento continuo.

Servicios de base de datos en la nube compatibles

Se admiten los siguientes tipos de servicio de base de datos en nube para su uso con ArcGIS Enterprise on Kubernetes:

  • Amazon RDS for PostgreSQL
  • Amazon Aurora PostgreSQL
  • Azure Database for PostgreSQL: Flexible Server
  • Google Cloud SQL for PostgreSQL
  • Google Cloud AlloyDB for PostgreSQL

Nota:

Para minimizar los problemas de latencia y conectividad, se recomienda que cualquier servicio de base de datos en la nube utilice el mismo proveedor de nube y la misma región que ArcGIS Enterprise.

Requisitos de base de datos

Un almacén relacional en la nube configurado con ArcGIS Enterprise on Kubernetes debe cumplir los siguientes requisitos:

  • La versión de la instancia PostgreSQL debe ser compatible con esa versión de ArcGIS Enterprise on Kubernetes
    • ArcGIS Enterprise 12.0: PostgreSQL versión 15.x o 16.x
    • ArcGIS Enterprise 11.5: PostgreSQL versión 15.x o 16.x
    • ArcGIS Enterprise 11.4: PostgreSQL versión 15.x
  • La base de datos debe ser accesible en red desde el clúster de Kubernetes. Algunos grupos de seguridad y cortafuegos pueden bloquear el acceso directo a la base de datos de forma predeterminada.
  • La autenticación del nombre de usuario y la contraseña de la base de datos debe utilizarse para la cuenta de administrador.
  • Debe instalar el plug-in de PostGIS y habilitar el tipo de espacio PostGIS. Esta es la configuración predeterminada para AWS y Google Cloud, pero debe agregarse a las extensiones permitidas en Azure. Actualmente, solo se admite PostGIS 3.5.2 y versiones anteriores debido al problema 5978 de PostGIS.

Conexiones y dimensionamiento de instancias

Es importante tener en cuenta y asignar un dimensionamiento suficiente a su instancia de base de datos, ya que muchos servicios no permiten redimensionar la instancia. Además, redimensionar una instancia después de haber estado en uso puede ser disruptivo o provocar problemas imprevistos.

Cada conexión a una base de datos consume memoria y CPU en los servidores de bases de datos y repercute en las necesidades de hardware.

Por ejemplo, un pod que se está ejecutando para un servicio de entidades alojado puede utilizar hasta 100 conexiones de base de datos cuando hay 100 peticiones simultáneas. Dado que es habitual tener dos pods en ejecución para servicios de entidades alojados, debe haber 200 conexiones disponibles. Para tener en cuenta otras solicitudes de servicio, se recomiendan 100 adicionales, con un total de 300.

Si es posible, los pods de servicios de entidades alojados utilizan la agrupación para reutilizar conexiones. Como resultado, 300 conexiones pueden ser suficientes para manipular hasta 1.000 peticiones por segundo. El valor predeterminado para la mayoría de las bases de datos en la nube suele ser inferior a 300 conexiones, por lo que se recomienda aumentar el límite de conexiones a 300 o más.

Nota:

No se admite el uso de pgBouncer como proxy para agrupar conexiones de bases de datos al almacén relacional en la nube.

Las bases de datos utilizan memoria RAM para mejorar el rendimiento de los datos a los que se accede con frecuencia. Los servicios de entidades alojados aportan generalmente la mayor cantidad de datos. El uso puede variar considerablemente, ya que muchos servicios pueden utilizarse con poca frecuencia, mientras que a otros se puede acceder constantemente. Si sabe que se va a acceder de forma constante a algunos servicios de entidades alojados y puede estimar su tamaño, puede que merezca la pena prever RAM adicional.

Recomendaciones de hardware

Para un rendimiento sólido con una carga media, se recomienda que utilice instancias de base de datos con lo siguiente:

  • 4 CPU virtuales
  • 16 GB RAM

Para volúmenes de datos mayores a los que se accede con frecuencia, se recomienda que agregue más RAM.

Almacenamiento

Las necesidades de almacenamiento de su organización variarán en función de los datos que utilice. Una recomendación base es 100 GB de almacenamiento, lo que puede ser adecuado para unos cientos de servicios de entidades alojados con un mínimo de adjuntos. Los adjuntos de entidades, especialmente las imágenes de alta resolución, pueden consumir cantidades excesivamente grandes de espacio. Si prevé tener adjuntos de gran tamaño, es esencial que trabaje con su departamento de SIG para calcular el espacio de almacenamiento, ya que algunas organizaciones superan 1 TB de almacenamiento para satisfacer sus necesidades de datos.

Uso del software

Al configurar un almacén relacional en la nube, tenga en cuenta que su base de datos resultante se utilizará exclusivamente para ArcGIS Enterprise on Kubernetes. Se recomienda que no existan otras bases de datos o datos en esa base. Además, el software crea bases de datos, esquemas y usuarios en la base de datos, como los siguientes:

  • Una geodatabase corporativa para almacenar datos de servicios de entidades alojados
  • Una base de datos para almacenar información sobre contenido y elementos
  • Una base de datos para almacenar la información de webhooks

El usuario de base de datos administrativo que proporcione a ArcGIS Enterprise se utiliza durante la configuración inicial y los procesos de copia de seguridad y restauración. Se crearán usuarios específicos con menos privilegios para uso operativo, lo que garantiza una mayor seguridad.

Mantenimiento continuo

Cuando se utiliza un almacén relacional en la nube, su administrador informático o de base de datos debe realizar el mantenimiento y la administración continuos del sistema. A continuación, se muestran algunos ejemplos:

  • Administre el sistema de base de datos aplicando parches y monitorizando el uso del hardware, en particular, el almacenamiento.
  • Administre la configuración de todo el sistema, como el número de conexiones.

El software de ArcGIS Enterprise, por otra parte, se encarga del mantenimiento continuo del software. A continuación, se muestran algunos ejemplos:

  • Haga una copia de seguridad y restaure la base de datos durante los procesos rutinarios de copia de seguridad y restauración de la organización.
  • Administre columnas, tablas, índices y usuarios.

Los administradores pueden crear sus propias copias de seguridad de la base de datos, pero es esencial que consulte con el Soporte técnico de Esri antes de restaurar una copia de seguridad de la base de datos de forma aislada, ya que hacerlo puede causar problemas de sincronización con otros requisitos fundacionales, como el almacén de objetos.

Actualizar un almacén relacional en la nube

Cuando se utiliza un almacén relacional en la nube, la actualización de ArcGIS Enterprise on Kubernetes no actualizará automáticamente la versión de la instancia de la base de datos. Consulte la documentación de su servicio de base de datos en la nube para obtener instrucciones sobre cómo actualizar la instancia de la base de datos, incluida información sobre los requisitos previos necesarios, el tiempo de inactividad previsto, las prácticas recomendadas para las copias de seguridad y las pruebas, y las opciones para la recuperación de datos en caso de que falle la actualización. Antes de actualizar la instancia de la base de datos, asegúrese de que la nueva versión de la base de datos sea compatible con su versión de ArcGIS Enterprise on Kubernetes.