Notas
El OVS desarrolló el primer prototipo del mapa de valores de suelo urbano para el Gran La Plata
En base a la campaña de relevamiento de valores 2023 y el entrenamiento de un modelo de valuación masiva el equipo de investigación de la CIC elaboró el primer mapa de valores de suelo urbano para la región.
Mayo de 2024
Contribución: Marcos May (LINTA-CIC)
El OVS dió los primeros pasos para implementar una metodología de valuación masiva orientada a la elaboración de mapas de valores de suelo urbano. Dicho enfoque combina técnicas avanzadas de machine learning y análisis espacial. El desarrollo del primer modelo predictivo se entrenó con terrenos ubicados en el Gran La Plata. El relevamiento de la muestra de valores de oferta se realizó durante el año 2023. El principal resultado del estudio fue la predicción de valores tanto a nivel de cuadra urbana como de parcela catastral. A continuación se presentan algunos resultados de los valores agregados a nivel de los distritos urbanísticos y una reseña metodológica del desarrollo en curso.
Tendencias observadas en el mapa
Del estudio se desprende que el área urbana [1] del Aglomerado del Gran La Plata presentó un valor unitario de tierra (VUT) [2] de 196 dólares por metro cuadrado. Mientras que el área urbana del partido de La Plata presentó un valor promedio de 212 dólares por metro cuadrado, en el partido de Ensenada dicho indicador fue de 135 dólares por metro cuadrado y en Berisso de 113 dólares por metro cuadrado.
Frente a estos valores medios, las zonas urbanísticas con mayor valor fueron: en el partido de La Plata el “Eje Fundacional Tramo 1” (entre avenidas 1 y 13) y “Eje Fundacional Tramo 2” (entre avenidas 13 y 19), con valores de 839 a 786 dólares por metro cuadrado; en el partido de Ensenada las zonas del corredor de la avenida Cestino, “Sector 1 y 2”, con valores de 227 a 215 dólares por metro cuadrado; en el partido de Berisso la “Zona Residencial R2c” y la “Zona Comercial Administrativa C1a”, con valores de 193 a 179 dólares por metro cuadrado.
Por su parte, las zonas urbanísticas con los valores más bajos en área urbana [3], fueron: en el partido de La Plata la “Zona Residencial de Promoción U/R3” (entre calles 91, 98, 14 y 17) en el límite entre las localidades de Villa Elvira y Altos de San Lorenzo, con un valor de 38 dólares por metro cuadrado; en el partido de Ensenada la “Subárea Urbanizada Tres S.S.U.3” (asociada a la Avenida Almirante Brown entre calle 5 y 24) en la localidad de Punta Lara, con un valor de 50 dólares por metro cuadrado; en el partido de Berisso la “Zona Residencial R3d” (delimitada por la calle 130, 31, 23 y 23) entre Villa Progreso y Barrio El Carmen Este, con un valor de 47 dólares por metro cuadrado.
Descripción de la metodología utilizada para el desarrollo del modelo predictivo
La metodología se basó en un enfoque que integró los datos de oferta inmobiliaria recolectados por el Observatorio con variables descriptivas del contexto urbano. En lugar de depender únicamente de métodos tradicionales de valuación (modelos lineales de regresión espacial o geográficamente ponderadas), se aprovecharon las capacidades predictivas de los modelos de machine learning para mejorar la precisión del mapa de valor de suelo. La muestra utilizada constó de 1720 registros.
En primer lugar, a la muestra de oferta de valores de los terrenos se le agregó un conjunto de variables orientadas a describir el contexto urbano en el cual se localizan las observaciones. Entre las variables incorporadas se incluyeron, en esta primera instancia: las distancias a comercios, industrias, rellenos sanitarios, estaciones de ferrocarril, espacios verdes, autopistas, rutas y avenidas. De modo complementario, se incorporaron otras variables como el estrato socioeconómico de los hogares del vecindario, el potencial constructivo según el factor de ocupación total y el volumen constructivo real que surge del procesamiento de las imágenes satelitales.
Una vez preparado el dataset con la variable dependiente y las variables independientes se elaboró un modelo de regresión lineal orientado a homogeneizar los valores de la variable dependiente (USD/m2). Para ello se analizó en cuánto cambia porcentualmente el precio del metro cuadrado según la incidencia de la superficie del terreno, la longitud del frente, la forma del lote (regular o irregular), la ubicación en la cuadra (esquina, medial o interno) y el tipo de barrio en el que se ubica el terreno (cerrado o abierto).
De modo complementario, para estimar los coeficientes de homogeneización del precio y determinar un valor unitario de la tierra (VUT) comparable e independiente de las características intrínsecas del lote, se incorporaron al modelo de regresión lineal los efectos de dependencia espacial a los residuos estadísticos del modelo.
El siguiente paso consistió en detectar posibles valores atípicos en la muestra teniendo en cuenta su vecindario (se estableció como vecindario un área de 500 metros de radio para cada observación). Se consideraron como dato atípico los registros con un precio un 50% mayor o menor al precio de referencia del vecindario. En base a este criterio, al momento de entrenar el modelo predictivo de valor de suelo urbano, un 13% de la muestra fue excluida del entrenamiento.
En línea con la literatura especializada en las técnicas de valuación automática masiva (IDECOR, 2019; Piumetto et al., 2019; Carranza et al., 2022) al momento de entrenar el modelo predictivo se seleccionó el algoritmo quantile random forest (QRF). Esta técnica surge de una adaptación del algoritmo regression random forest (RRF): en vez de predecir la media realiza predicciones a nivel de los cuantiles. Se basa en árboles de clasificación y regresión (CART), donde cada árbol se entrena con submuestras aleatorias de datos y subconjuntos aleatorios de variables. La secuenciación de las bifurcaciones anidadas en forma de árbol tiene por objeto seleccionar las variables explicativas y el punto de corte en nodos que minimizan el error cuadrático medio.
A continuación se realizó el testeo del modelo para calcular el error a través de la validación cruzada con observaciones de valores de la muestra original, las cuales fueron reservadas a tal efecto (es decir, nunca fueron mostradas al algoritmo entrenado). Luego del testeo, se calculó el índice conocido como mean absolute percentage error (MAPE) que arrojó un error del 23%. Consideramos que este resultado es muy aceptable por tratarse del primer prototipo realizado con un set de variables independientes reducidas y una muestra acotada.
Una vez entrenado y testeado el modelo de QRF para predecir los valores del suelo urbano para el conjunto del aglomerado del Gran La Plata, se añadieron las variables independientes a cada uno de los segmentos de cuadra y las parcelas catastrales urbanas con el objetivo de aplicar el modelo obtenido para calcular el valor homogeneizado de la tierra (VUT).
En resumen, esta metodología representa un avance significativo en la creación de mapas de valores de suelo urbano al combinar métodos tradicionales con técnicas avanzadas de machine learning y análisis espacial. Las aplicaciones de este desarrollo son múltiples y resultan de vital importancia en el ámbito de las políticas públicas asociadas a la planificación urbana, la política fiscal, el ordenamiento territorial y la política habitacional.
Notas:
[1] El Área Urbana es definida por ordenanza municipal de acuerdo a pautas establecidas en el decreto-ley 8.912 de Ordenamiento Territorial y Usos de Suelo
[2] El mismo surge de la homogeneización de los valores tomando como referencia el lote típico encontrado en el aglomerado urbano analizado.
[3] No se tomó en cuenta para el cálculo de los valores citados en esta nota los valores del Área Complementaria establecida decreto-ley 8.912.