(Español) Reflexiones de una colaboración público-privada en ciencia de datos para mejorar el medio ambiente

By Monday August 23rd, 2021 Blog

En el marco de la iniciativa Empatía, la Superintendencia del Medio Ambiente (SMA) y el GobLab UAI, trabajaron en el proyecto “Inteligencia artificial para el cuidado del medio ambiente y la salud de la población

23 de agosto 2021

Reflexiones de una colaboración público-privada en ciencia de datos para mejorar el medio ambiente

En el marco de la iniciativa Empatía, la Superintendencia del Medio Ambiente (SMA) y el GobLab UAI, trabajaron en el proyecto “Inteligencia artificial para el cuidado del medio ambiente y la salud de la población: modelo predictivo para episodios críticos de contaminación en el aire para una zona industrial de Chile”.

En el marco de la iniciativa Empatía, la Superintendencia del Medio Ambiente (SMA) y el GobLab UAI, trabajaron en el proyecto “Inteligencia artificial para el cuidado del medio ambiente y la salud de la población: modelo predictivo para episodios críticos de contaminación en el aire para una zona industrial de Chile”.

El proyecto buscaba implementar una herramienta que logre predecir el nivel de la calidad del aire y con ello la ocurrencia de episodios críticos, en base a los datos de emisiones de industrias contaminantes, estaciones de calidad del aire y datos meteorológicos de las comunas de Concón, Quintero y Puchuncaví, con objeto de optimizar la gestión de la SMA y verificar el cumplimiento de las metas establecidas en el Plan de Descontaminación Ambiental vigente en la zona.

El trabajo, que se adjudicó financiamiento de la iniciativa Empatía, se desarrolló entre los meses de agosto 2020 y abril del 2021. El proyecto concluyó con la publicación y presentación de los resultados que se realizó en la llamada final de la iniciativa. Los resultados de índole técnica pueden ser encontrados en el repositorio github del proyecto (https://github.com/GobLab-UAI/prediccion-so2). A continuación, detallamos sobre la experiencia del trabajo realizado con la SMA.

El desarrollo del proyecto fue muy enriquecedor para el equipo, ya que permitió unir a una institución pública (SMA) y una privada (GobLab UAI) para la resolución de un problema. En esa línea, uno de los grandes desafíos que se tiene a la hora de trabajar con instituciones públicas es la obtención de los datos. Este proceso lo lideró la Superintendencia, lo que facilitó el trabajo de exploración de los datos, permitió conocer las limitaciones de los instrumentos y tomar decisiones oportunas al respecto. Por otro lado, como los recursos públicos siempre son más escasos, aliarse con una organización externa permitió tener personas dedicadas completamente al desarrollo del modelo. 

Otro punto interesante, fue el poder tener personas de distintas especialidades trabajando en conjunto. En general, cuando se realizan proyectos de diencia de datos, los/as científicos/as de datos deben estudiar el fenómeno en detalle si quieren comprender los efectos y resultados de todos sus experimentos. En este caso, la Superintendencia aportó con la expertiz técnica en el tema medio ambiental y permitió ahorrar tiempo en la toma de decisiones para la generación del modelo. En ese sentido, contar con la retroalimentación de las personas que van a ocupar el modelo fue un gran acierto, especialmente para definir clases y tiempos de predicción que fueran útiles para su trabajo diario. Además, la contratación de un consultor en machine learning permitió explorar otras alternativas más allá de los métodos tradicionales.

Uno de los grandes desafíos para el equipo fue la consolidación de los datos. En un principio se pensó que el trabajo en esta área iba a ser menor, puesto que existían bases de datos de las distintas fuentes de emisiones y estaciones de calidad del aire. Sin embargo, no se consideró que la información no estaba homogeneizada, ya que algunos registros eran minutales, otros horarios, no todas las fuentes y estaciones medían los mismos parámetros y no todos los registros partían desde la misma época. Esto sumado a la presencia de datos nulos, erróneos y otros problemas clásicos del procesamiento de datos,  implicó un esfuerzo adicional que no se había considerado. Como aspecto positivo de lo anterior, se pudo dimensionar el estado real de las bases de datos de la SMA y aportar con varias ideas de cómo mejorarlas para realizar trabajos futuros.

Si bien el proyecto bajo el fondo Empatía culminó, hasta la fecha la SMA y el GobLab UAI siguen colaborando en la evaluación de los modelos desarrollados y planificando futuros proyectos que utilicen la ciencia de datos para resolver problemas públicos.