
Este repositorio contiene tres conjuntos de datos generados a partir de un modelo de aprendizaje automático aplicado a imágenes satelitales de alta resolución. El conjunto de datos incluye estimaciones de ingresos per cápita a una resolución de 50x50 metros para los años 2013, 2018 y 2022, utilizando imágenes satelitales del Área Metropolitana de Buenos Aires (Argentina) y datos del censo y encuestas de 2010. El modelo, basado en la arquitectura EfficientNetV2, alcanzó una alta precisión en la predicción de ingresos familiares (R²=0.878), superando los métodos existentes en resolución espacial y rendimiento. Los conjuntos de datos se publican en formato shapefile. Dado que las predicciones para cada celda individualmente presentan cierta variación aleatoria, recomendamos que los resultados se utilicen promediando las estimaciones para cada área de interés (municipios, barrios, secciones o fracciones censales) y no a nivel individual. Como detallamos a lo largo del artículo, los resultados agregados, incluso en áreas pequeñas como radios censales, predicen de manera precisa los ingresos de los hogares. Además, dentro de este repositorio, es posible acceder y utilizar los parámetros entrenados del modelo para hacer predicciones sobre diferentes imágenes satelitales. Las bases pueden ser visualizadas desde este link: https://ingresoamba.netlify.app
This repository contains three datasets generated from a machine learning model applied to high-resolution satellite imagery. The dataset includes per capita income estimates at a 50x50 meter resolution for the years 2013, 2018, and 2022, using satellite images from the Metropolitan Area of Buenos Aires (Argentina) and 2010 census+survey data. The model, based on the EfficientnetV2 architecture, achieved high accuracy in predicting household incomes (Rsquared=0.878), surpassing existing methods in spatial resolution and performance. Datasets are published in geoparquet format. Since the predictions for each cell individually present some random variation, we recommend that the results are used averaging out the estimations for each area of interest (municipalities, neighborhoods, sections or census tracts) and not at an individual level. As we detailed throughout the paper, the aggregated results, even in small areas such as census tracts, predict in a precise way the households’ income. Furthermore, inside this repository, it is possible to access and use the model’s trained parameters to make predictions about different satellite images. Data can be visualized by accessing: https://ingresoamba.netlify.app
La base descargada tiene las siguientes columnas: ------------------------------------------------------------- id: identificador del rectángulo donde se realiza la estimación del ingreso. Es consistente en las bases de los tres años.- geometry: polígono con los límites que demarcan la estimación- link: código del radio censal al que pertenece el rectángulo- real_value: ingreso medio del radio censal- prediction: predicción del ingreso para el rectángulo, expresada en desvíos estándar respecto al logaritmo del ingreso medio de los hogares del AMBA.- error: diferencia entre el ingreso del radio censal y el promedio de las prediccionespara ese radio.------------------------------------------------------------ Si se desea expresar los ingresos en términos de deciles del AMBA de 2010, el archivo "deciles_2010.xlsx" contiene los límites de los deciles para ese año. Los datos se encuentran bajo licencia Creative Commons Attribution 4.0 International, que permiten la redistribución y reutilización, solo tenés que citarme apropiadamente. Ante cualquier consulta, no dudes en contactarme! Nicolás Abbate, abbatenicolas@gmail.com
The downloaded database contains the following columns: ------------------------------------------------------------- id: Identifier of the rectangle where the income estimation is made. It is consistent across the databases of the three years.- geometry: Polygon with the boundaries of the estimation.- link: Code of the census tract to which the rectangle belongs.- real_value: Average income of the census tract.- prediction: Income prediction for the rectangle.- error: Difference between the census tract income and the average of the predictions for that tract.------------------------------------------------------------ If you want to express the predicted income in terms of 2010 AMBA's deciles, the file deciles_2010.xlsx contains the bounds for each decile. The data is licensed under the Creative Commons Attribution 4.0 International license, which allows redistribution and reuse, provided you cite appropriately. If you have any questions, feel free to contact me. Nicolás Abbateabbatenicolas@gmail.com
| selected citations These citations are derived from selected sources. This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | 0 | |
| popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network. | Average | |
| influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically). | Average | |
| impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network. | Average |
