Nuevas herramientas de agrupamiento en ArcGIS Pro 2.1: más aprendizaje automático al alcance de su mano

por ruthartr

Con el lanzamiento de Pro 2.1, ahora cuenta con 3 poderosas nuevas herramientas de agrupamiento en la caja de herramientas de Estadísticas espaciales que lo ayudarán a encontrar patrones y a extraer sentido de sus datos de nuevas maneras. ¿Qué hace un algoritmo de agrupamiento exactamente? Encuentra subconjuntos naturales o agrupaciones de características basadas en la ubicación (solo componente espacial), valores (solo atributos) o una combinación de ubicación y valores. Los algoritmos de agrupamiento son un tipo de aprendizaje automático no supervisado, lo que significa que no tiene que definir lo que significa ser un grupo por adelantado (a menudo denominado entrenamiento del modelo). En cambio, el algoritmo lo hace por usted mediante la evaluación de los datos y la búsqueda de patrones naturales que existen.

Encontrar patrones ocultos en los datos de puntos
 

¿Por qué?
Visualmente, buscar patrones en los datos de puntos puede volverse rápidamente difícil, especialmente a medida que nuestros conjuntos de datos se vuelven cada vez más grandes. Las ocurrencias o incidentes de tráfico de un año pueden sumar de decenas a cientos de miles con puntos superpuestos que ocultan los patrones reales de nuestros datos. El uso de la herramienta de agrupamiento basado en densidad puede revelar patrones que son muy difíciles de ver con solo mirar los puntos de datos en el mapa.

¿Qué datos?
La Agrupación basada en densidad se usa cuando busca clusters en datos de puntos. Una empresa de agua urbana con datos de ruptura de tubería podría crear grupos para localizar áreas propensas a problemas. Un entrenador con datos de puntos que muestren la ubicación de los tiros de goles de gol podría determinar la mejor posición para disparar. Los datos de terremotos podrían usarse para crear clusters que delineen las zonas de falla. Si su atención se centra en el patrón espacial en los datos de puntos, los métodos de agrupamiento basados ​​en la densidad podrían ser exactamente lo que está buscando.

¿Como funciona?
La herramienta Clustering basada en Density utiliza algoritmos de aprendizaje automático no supervisados ​​para determinar las áreas donde las características de los puntos están concentradas y donde están separadas por áreas vacías o dispersas. Hay tres algoritmos que alimentan la herramienta de agrupación basada en la densidad: 1) Distancia definida (DBScan), 2) Autoajustable (HDBScan) y 3) Escala múltiple (OPTICS). Todos los algoritmos difieren ligeramente bajo el capó y, según el análisis y sus necesidades, ofrecen diferentes niveles de personalización. Sugerimos leer más sobre cómo funcionan y experimentar para ver qué método se ajusta mejor a su análisis. Dependiendo del método seleccionado, las herramientas también generan gráficos potentes para ayudarlo a comprender los miembros del clúster y cómo fueron seleccionados.



Density Based Clustering results clustering Traffic Alerts by Waze in the Los Angeles area
 

Aprovechando los datos de sus atributos con clustering multivariable
 

¿Por qué?

Cuando sus datos contienen más información que solo la ubicación, las herramientas de agrupamiento multivariante le permiten desbloquear los datos de sus atributos. Gran parte de la información a la que tenemos acceso tiene información de atributos valiosa, pero incluso un puñado de variables puede ser un desafío para visualizar e interpretar patrones. Las herramientas de agrupamiento multivariante le permiten alimentar variables en el algoritmo para crear clusters donde los miembros tienen valores similares. Dependiendo de sus datos y necesidades de análisis, puede elegir la versión espacialmente restringida o no espacial de la herramienta. Los parámetros de restricción opcionales también se pueden configurar para el análisis, lo que le permite crear clústeres de un cierto tamaño o con un valor superior o inferior a un umbral de corte. Si esto le suena familiar, es posible que haya utilizado la herramienta Agrupamiento de análisis: las nuevas herramientas de agrupamiento multivariante se basan y añaden nuevas características a los métodos de Análisis de agrupamiento.

¿Qué datos?

 
Hay tantas aplicaciones a las que se puede aplicar la agrupación multivariada, y puede funcionar tanto en datos de puntos como de polígonos. Los datos del censo son un gran candidato para el agrupamiento multivariable porque hay tantos atributos. Además de agrupar los datos del censo en función de múltiples atributos, también puede crear clusters con un valor mínimo de población o un ingreso familiar máximo. Los datos de los clientes que combinan patrones de compra y características demográficas podrían ayudar a orientar su próxima campaña de ventas. Los datos ambientales, como las muestras de geoquímica del suelo o del agua, podrían usarse para encontrar grupos de contaminación o su próximo objetivo de exploración.

¿Como funciona?


El agrupamiento multivariante espacialmente restringido es una implementación del algoritmo SKATER y funciona mediante el crecimiento y poda de un árbol de expansión mínimo para crear clusters similares. Aprenda más sobre los algoritmos detrás de SKATER aquí. El clúster multivariante es una implementación del algoritmo k-means ++ y separa las funciones para que las diferencias dentro del clúster se minimicen.

Estas herramientas también aprovechan al máximo el motor de gráficos incorporado de Pro. Después de ejecutar cualquiera de las herramientas de clúster multivariable, se genera un diagrama de caja interactivo que lo ayuda a profundizar en los resultados y comprender mejor las características de cada clúster al explorar la distribución de los datos y cómo encaja cada clúster.



Spatially Constrained Multivariate Clustering Results on ocean water samples.

Esperamos que estas poderosas técnicas de aprendizaje automático le ayuden a desbloquear los patrones ocultos en sus datos. Esté atento a los blogs y casos de estudio que destacan estas nuevas herramientas en los próximos meses.


Lea el artículo original | Para más información sobre herramientas de agrupamiento en ArcGIS Pro 2.1, ¡escríbanos! un ejecutivo SIGSA lo está esperando

Comentarios

Entradas más populares de este blog

Crea un mapa demográfico en 5 minutos

Agregar y usar fotos e imágenes en ArcGIS Online

Como GM planea y administra el riesgo de la cadena de suministro