Cómo funciona la herramienta Localizar regiones

La herramienta Localizar regiones identifica las mejores ubicaciones en el ráster de salida que cumplen con los requisitos de tamaño y las restricciones espaciales especificados. Las regiones son grupos de celdas contiguas que tienen el mismo valor. Estos son algunos de los requisitos y restricciones que se pueden definir en esta herramienta: el área total de selección, el número de regiones que debe distribuirse entre el área total, la forma de las regiones deseadas y las distancias mínimas y máximas entre las regiones.

Localizar regiones se utiliza con frecuencia junto con la herramienta Conexiones de región óptimas para seleccionar y luego unir las mejores regiones disponibles de la forma más eficiente. Para realizar este análisis, primero necesita una superficie de adecuación, que puede crear empleando otras herramientas de este conjunto de herramientas. A continuación, utilice la herramienta Localizar regiones para identificar las mejores regiones disponibles. Por último, utilice Conexiones de región óptimas para determinar la red de rutas de menor coste entre las regiones. Para obtener más información sobre cómo crear un modelo de adecuación, consulte Comprender el análisis de superposición.

Ejemplos de problemas solucionados mediante la herramienta Localizar regiones

Utilizando una superficie creada a partir de un modelo de adecuación se pueden identificar las mejores regiones para lo siguiente:

  • El hábitat preferido para los ciervos que se debe conservar. Se necesitan ocho terrenos de hábitat (regiones) para mantener una población viable y cada región debe tener aproximadamente 50 acres contiguos. Para respaldar las oportunidades de reproducción de las manadas, las regiones deben estar lo suficientemente cerca entre sí para que se puedan conectar de forma factible con corredores ecológicos.
  • Las mejores ubicaciones para extraer la madera en una explotación forestal. Para que sea viable desde el punto de vista económico, las áreas (regiones) de la explotación forestal deben tener como mínimo 250 acres contiguos y cada región debe estar separada del resto de una milla.
  • La ubicación idónea para un nuevo centro comercial. Para el centro comercial se requieren 60 acres; sin embargo, para el proceso de construcción, es necesario que el área sea contigua y que la forma del sitio para la edificación (región) sea lo más compacta posible.

Agrupar celdas en regiones

Hay seis formas principales mediante las cuales crear regiones a partir de celdas individuales del ráster de adecuación.

  • Las celdas se agruparán en una única región.
  • Las celdas se agruparán en un número específico de regiones del mismo tamaño.
  • Las celdas se agruparán en un número específico de regiones del mismo tamaño y se respetarán las restricciones de distancia indicadas entre las regiones.
  • Las celdas se agruparán en un número específico de regiones de tamaño distinto, que se controlará mediante los requisitos de área mínima y máxima definido para las regiones.
  • Las celdas se agruparán en un número específico de regiones de tamaño distinto, que se controlará mediante los requisitos de área mínima y máxima definido para las regiones y de forma que no pueda haber dos regiones dentro de la distancia mínima indicada o fuera de la distancia máxima indicada.
  • Igual que la opción anterior, excepto que las regiones preexistentes que ya se asignaron al área de estudio se deberán tener en cuenta en el proceso de selección.

Algoritmo general para Localizar regiones

La herramienta Localizar regiones toma como entrada un ráster en el que los valores más altos representan un grado mayor de utilidad. A partir de este ráster, la herramienta selecciona las mejores regiones que cumplen con los requisitos de región y las restricciones espaciales especificados.

La localización de regiones con esta herramienta se desarrolla en cuatro pasos. Estos pasos se indican a continuación, junto con una descripción detallada:

  1. Eliminar las ubicaciones que no se consideran adecuadas para el proceso de selección. Algunos ejemplos serían masas de agua, edificios existentes y áreas demasiado empinadas. Es un paso de preprocesamiento.
  2. Definir las características de las regiones deseadas. Algunos ejemplos serían el tamaño, la forma y la orientación. Este paso se consigue definiendo parámetros en la herramienta.
  3. Identificar todas las regiones candidatas del ráster de entrada basándose en la decisión definida por el usuario de mantener la forma de una región y maximizar su utilidad. Este paso se consigue mediante el algoritmo de crecimiento de la región que implementa la herramienta.
  4. Seleccionar las mejores regiones entre las regiones candidatas utilizando criterios de evaluación definidos por el usuario. Por ejemplo, seleccionar solo las regiones con el valor medio más alto. Este paso se lleva a cabo dentro de la herramienta, aplicando un algoritmo de selección y utilizando el método de evaluación especificado.

El algoritmo principal para identificar las regiones candidatas utiliza una técnica de crecimiento de la región parametrizada (PRG) que trata cada celda identificada como posible valor de inicialización a partir del cual crecerá la región. La selección de las celdas contiguas que se agregarán a una región se basa en la evaluación de la decisión entre la contribución de las celdas a mantener la forma deseada de la región en relación con la utilidad (adecuación) del valor del atributo de las celdas. Cuanto más alto es el valor del atributo, mayor es la utilidad. Las posibles regiones candidatas seguirán creciendo hasta que se cumplan los requisitos de área especificados para la región. Este proceso de crecimiento se realiza para cada valor de inicialización. Cada región resultante se considera una opción candidata y, en esta fase, habrá muchas regiones candidatas superpuestas. En este paso no se asigna ninguna celda y una celda puede formar parte de varias regiones candidatas.

Para seleccionar las mejores regiones, se utiliza un algoritmo de selección que evalúa cada región candidata identificada mediante la técnica de PRG para determinar la configuración idónea según estas preferencias:

  • Los criterios especificados para el Método de evaluación, como el valor medio más alto, la suma más alta o la máxima cantidad de borde.
  • Los criterios de evaluación entre regiones, tal y como se define mediante los parámetros Distancia máxima y Distancia mínima.

Cuando se desean varias regiones, el Método de selección le permite controlar mejor cómo se seleccionan las mejores regiones. Estas son COMBINATORIAL y SEQUENTIAL.

  • Si se ha seleccionado el método COMBINATORIAL, se evaluarán todas las combinaciones posibles del número de regiones deseado. Por ejemplo, con este método, si el Número de regiones se establece en ocho y la cantidad posible de regiones creadas a partir del PRG es de 150.000, se probarán todas las combinaciones de las ocho regiones disponibles en las 150.000 regiones candidatas para identificar las ocho regiones óptimas según el Método de evaluación y las restricciones espaciales. Es posible que la única mejor región no se seleccione si no forma parte de la combinación óptima de las ocho regiones.
  • Si se ha seleccionado el método SEQUENTIAL, la primera región seleccionada será la mejor región según el Método de evaluación y siempre que cumpla las restricciones espaciales. La segunda región seleccionada será la siguiente mejor región según el método de evaluación y siempre que cumpla las restricciones espaciales en relación con la primera región seleccionada. Este proceso continúa hasta alcanzar el Número de regiones.

Aunque las regiones candidatas se pueden solapar, una celda solo se puede asignar a una región. Una vez que se selecciona una región, el resto de regiones candidatas que incluyen una celda asignada ya no se tendrán en cuenta en el siguiente proceso de selección de regiones. El resto de celdas incluidas en las regiones candidatas sí que se tendrán en cuenta para otras regiones candidatas.

Cómo se distribuyen los valores de inicialización

Para reducir el tiempo de procesamiento, en lugar de aumentar las regiones a partir de ubicación de celda disponible en el ráster de entrada, se pueden aumentar las regiones candidatas partiendo de ubicaciones de celda identificadas, conocidas como valores de inicialización. El número de valores de inicialización a partir del cual se pueden aumentar las regiones se pueden controlar mediante el parámetro Número de valores de iniciación desde los que iniciar el crecimiento.

El número de valores de inicialización especificado se distribuye por el ráster según la distribución espacial de los valores de utilidad del ráster de entrada. Es decir, se ubican más valores de inicialización en las áreas del ráster de entrada donde los valores de la utilidad son más altos. Se supone que es más probable que las mejores regiones se ubiquen en aquellas áreas donde los valores de la utilidad del ráster de entrada sean más altos.

Para identificar las ubicaciones específicas de los valores de inicialización, se crea una distribución a partir de todas las celdas del ráster de entrada y de sus valores de utilidad. Las celdas que tienen un valor de utilidad alto tendrán una proporción mayor de la distribución. A partir de esta distribución se selecciona un valor aleatoriamente para identificar la ubicación de la celda donde debe ubicarse un valor de inicialización. Dado que las celdas que tienen valores de utilidad más altos representan una mayor proporción de la distribución, es más probable que se seleccionen estas ubicaciones.

Se realiza un ajuste adicional para garantizar que los valores de inicialización no estén demasiado cerca entre sí y que la distribución del número de valores de inicialización en un área determinada sea proporcional a la utilidad total de las celdas en dicha área.

Ejemplo de distribución de valores de inicialización

Ejemplo simplificado: tenemos un ráster con cuatro celdas y con los valores de utilidad 1, 2, 3 y 4. Se crea una distribución a partir de los cuatro valores. La suma de los valores de las celdas es de 10. Los valores se pueden ajustar en una escala de 0 a 1. La celda cuyo valor de utilidad es 1 contribuye al 10% de la distribución (de 0 a 0,1 de la distribución), la celda cuyo valor de utilidad es 2 contribuye al 20% (de 0,1 a 0,3 de la distribución), la celda cuyo valor de utilidad es 3 contribuye al 30% (de 0,3 a 0,6 de la distribución) y la celda cuyo valor de utilidad es 4 contribuye al 40% (de 0,6 a 1 de la distribución). Se selecciona un valor aleatorio entre 0 y 1. Hay un 40% de posibilidades de que el valor aleatorio se encuentre en el rango de distribución de 0,6 a 1, lo que significaría colocar un valor de inicialización en la ubicación de celda que tiene asignado el valor 4, que es la celda que tiene la mayor utilidad.

Ajustar la resolución del crecimiento de las regiones según el tamaño de las regiones deseadas

Además de utilizar el parámetro Número de seeds desde los que iniciar el crecimiento para reducir el tiempo de procesamiento, también puede mejorar el rendimiento utilizando el parámetro Resolución del crecimiento. Puede utilizar el parámetro Resolución del crecimiento para hacer que el algoritmo de PRG realice el crecimiento en una versión intermedia más gruesa del ráster de entrada. En este caso, una vez que se seleccionen las regiones deseadas de las regiones candidatas utilizando el ráster intermedio, las regiones resultantes se remuestrean según el Tamaño de celda para generar el ráster de salida final. La resolución del ráster intermedio viene determinada por el número de celdas asociadas a la Resolución del crecimiento especificada.

Para asegurarse de que va a haber celdas suficientes en cada una de las regiones resultantes y para reducir procesamientos innecesarios, se podría llevar a cabo un segundo ajuste en la resolución y en el número total de celdas identificadas en cada Resolución del crecimiento objetivo para el ráster intermedio. Según la resolución que se determine con la Resolución del crecimiento especificada, se identifica el número de celdas en el tamaño medio de la región. El tamaño medio de la región se calcula dividiendo el área total deseada entre el número de regiones especificado. Para asegurarse de que haya celdas suficientes en cada región seleccionada, si hay muy pocas celdas en el tamaño medio de la región, la resolución del ráster intermedio se afina (el tamaño de celda se reduce y, por lo tanto, el número de celdas aumenta). Para reducir procesamientos innecesarios, si hay demasiadas celdas en el tamaño medio de la región, la resolución del ráster intermedio se engrosa.

Los umbrales para determinar si el número de celdas en el tamaño medio de la región es demasiado pequeño o demasiado grande según la Resolución del crecimiento seleccionada. Por ejemplo, si se selecciona la opción de resolución LOW y el número de celdas en el tamaño medio de la región es demasiado bajo para obtener resultados razonables, en este caso es inferior a 1.800 celdas, se afinaría la resolución del ráster intermedio para que haya al menos 1.800 celdas en el tamaño medio de la región. Así se garantiza que haya celdas suficientes para generar una región razonable. Y al contrario, para reducir procesamientos innecesarios, si hay más de 5.400 celdas en el tamaño medio de la región, la resolución LOW del ráster intermedio se engrosa hasta que haya 5.400 celdas en el tamaño medio de la región.

Estos mismos ajustes se producen para los valores MEDIUM y HIGH de la Resolución del crecimiento, aunque los umbrales varían. Para la resolución MEDIUM, el umbral inferior para el tamaño medio de la región es de 3.200 celdas y el límite superior es de 9.600 celdas. Para la resolución HIGH, el umbral inferior para el tamaño medio de la región es de 7.200 celdas y el límite superior es de 21.600 celdas.

Como resultado de este segundo ajuste, el total de celdas para el ráster remuestreado intermedio donde se llevará a cabo el PRG para cada Resolución del crecimiento especificada puede ser inferior o superior al número de celdas objetivo.

Modo de determinar las regiones cuando se especifica un área mínima y máxima

Cuando se especifica un Área mínima de región y un Área máxima de región, habrá demasiadas combinaciones de regiones para comparar en el caso de que se consideren todos los tamaños de regiones posibles entre el tamaño mínimo y el máximo de cada valor de inicialización. Por lo tanto, para cada valor de inicialización, el algoritmo define el número de regiones cuyo tamaño se encuentra entre el valor mínimo y máximo que se crean mediante el proceso de PRG y que se tienen en cuenta en el proceso de selección COMBINATORIAL y SEQUENTIAL para identificar las mejores regiones.

Todos los tamaños de región se crean a partir de los tamaños de región mínimo, máximo y medio. Para determinar el tamaño medio de la región, el algoritmo divide el área total entre el número de regiones especificado. El tamaño medio de la región es el primer tamaño de la región que se generará a partir de cada valor de inicialización. Por lo general, el tamaño medio de la región será más cercano al tamaño mínimo o máximo especificado para el área. Es decir, será la distancia mayor entre Abs(máximo - medio) o Abs(mínimo- medio). Este valor se conoce como LargerDist.

Para calcular el intervalo del paso para definir los tamaños de región que se encuentran entre el tamaño medio de la región y la distancia más grande se utiliza esta fórmula:

StepInterval = LargerDist/(N - 1)
  • donde N corresponde al número de regiones especificado.

Partiendo del tamaño medio de la región, el StepInterval se agrega o resta secuencialmente hasta alcanzar el valor de distancia más grande. El mismo StepInterval se agrega o se resta secuencialmente en la dirección opuesta hasta que se alcanza el valor de distancia más pequeño.

En este paso de procesamiento, si el número de tamaños de región es menor que 4, se agregarán dos tamaños adicionales entre cada uno de los valores existentes. Si el número de tamaños es menor que 7 pero mayor que 3, se agregará un tamaño adicional entre cada uno de los valores existentes. Como resultado, el número mínimo de tamaños de región que se creará a partir de cada valor de inicialización es 7 y, dependiendo del número de regiones especificado, el número máximo de tamaños de región es 15.

Más adelante en esta sección se muestran algunos ejemplos sobre la interacción de estos parámetros.

Cuando se especifica un Área mínima de región y un Área máxima de región durante el proceso de selección COMBINATORIAL o SEQUENTIAL, se tiene en cuenta cada uno de los tamaños de región para cada valor de inicialización como región candidata y se prueba en el proceso de selección para identificar las mejores regiones.

Si solo se especifica un Área mínima de región y no se indica ninguna Área máxima de región, el área máxima se determina a partir del tamaño mínimo del área, del área total y del número de regiones especificado. Por ejemplo, el Área mínima de región está establecido en 5 millas cuadradas, el área total en 50 millas cuadradas y el número de regiones es 5. El área máxima posible se determina suponiendo que 4 de las regiones tienen el tamaño del área mínima; en nuestro ejemplo, 5 millas cuadradas, lo que da un total de 20 millas cuadradas. Quedan treinta millas cuadradas, que es la mayor área máxima posible y que, por lo tanto, será la que se asigne. Se aplica una lógica similar cuando solo se especifica un Área máxima de región, solo que en este caso el área mínima de región debe ser mayor que 0.

Ejemplo 1

En este ejemplo se han definido estos parámetros:

  • El área total está establecido en 300 millas cuadradas
  • El número de regiones está establecido en 6
  • El área mínima de región está establecido en 40 millas cuadradas
  • El área máxima de región está establecido en 100 millas cuadradas

El primer tamaño de región que se creará mediante el PRG es el tamaño medio de la región, que se determina dividiendo el área total entre el número de regiones; 50 millas cuadradas (300/6). La LargerDist es 50 (LargerDist = Abs(100 - 50)). El StepInterval es 10 (StepInterval = 50/(6 - 1)).

Para identificar el segundo tamaño de región a crear desde cada valor de inicialización se agrega el StepInterval al tamaño medio de la región (10 + 50), lo que da 60 millas cuadradas. Siga agregando el StepInterval de 10 al tamaño medio de la región hasta alcanzar el valor de distancia más grande. Así se identifica el tercer, cuarto, quinto y sexto tamaños de región, que son 70, 80, 90 y 100 millas, respectivamente. Finalmente, al restar de forma iterativa el StepInterval del tamaño medio de la región hasta alcanzar el valor de distancia más pequeño se identifica el séptimo tamaño de región para crear; en este caso, 40 millas cuadradas. En este ejemplo, el número de regiones que se creará a partir de cada valor de inicialización es 7; son: 40, 50, 60, 70, 80, 90 y 100 millas cuadradas.

Ejemplo 2

En este ejemplo se han definido estos parámetros:

  • El área total está establecido en 100 millas cuadradas
  • Defina el El número de regiones está establecido en 4
  • El área mínima de región está establecido en 10 millas cuadradas
  • El área máxima de región está establecido en 60 millas cuadradas

El primer tamaño de región que se creará mediante el PRG es el tamaño medio de la región, que se determina dividiendo el área total entre el número de regiones; 25 millas cuadradas.

La LargerDist es de 35 millas cuadradas (Abs(60 - 25)). El StepInterval es 11,6667 ( = 35/(4 - 1)). Al agregar de forma iterativa 11,6667 al tamaño medio de la región hasta alcanzar el valor de distancia más grande se obtienen los valores 36,6667, 48,3334 y 60. Al restar el StepInterval del tamaño medio de la región hasta que la diferencia sea igual o esté por debajo del valor mínimo da un resultado de 13,3333. Hasta ahora, el número de tamaños de región es 5; son: 13,3333, 25, 36,6667, 48,3334 y 60. Observe que no se garantiza que el valor mínimo o máximo que ha creado la distancia más pequeña se vaya a incluir en los tamaños de región (en este ejemplo, 13,3333 - 11,6667 = 1,6666, que es inferior a 10). De nuevo, el número mínimo de tamaños de región que se creará a partir de cada valor de inicialización es 7 y el número máximo de tamaños de región es 15. Dado que 5 es menor que el valor mínimo necesario de 7, se agregarán tamaños de región adicionales entre cada uno de los 5 tamaños de región. En este ejemplo, el número de regiones que se creará a partir de cada valor de inicialización es 9; son: 13,3333, 19,1667, 25, 30,8334, 36,6667, 42,5001, 48,3334, 54,1667 y 60 millas cuadradas.

Referencias

Brooks, Christopher J. 1997. A parameterized region growing programme for site allocation on raster suitability maps. International Journal of Geographic Information Science, 11:4, 375-396.

Brooks, Christopher J. 1997. A genetic algorithm for location optimal sites on raster suitability maps. Transactions in GIS, Vol. 2, No. 3, p 201-212.

Brooks, Christopher J. 1998. A genetic algorithm for designing optimal region configurations in GIS. Una tesis enviada por el Doctor en filosofía, Colegio Universitario, Universidad de Londres, Londres.

Brooks, Christopher J. 2001. A genetic algorithm for designing optimal patch configurations in GIS. International Journal of Geographic Information Science, Vol. 15, Nº 6, 539-559.

Li, Xia y Anthony Gar-On Yeh, 2005. Integration of genetic algorithms and GIS for optimal location search, International Journal of Geographic Information Science, Vol. 19, No. 5, 581-601.