Estrenamos una serie de cursos en temáticas de datos relevantes que hemos recogido de nuestra experiencia trabajando con el sector público, y conoceremos importantes hallazgos de investigaciones y proyectos en uso de algoritmos en el Estado.
9 de agosto 2022
Cómo logramos inspecciones proactivas con ciencia de datos
¿Cómo identificar de una lista inmensa de cosas por inspeccionar o fiscalizar, las de mayor riesgo, o las que tienen mayor probabilidad de incumplirse, para hacer que los recursos alcancen y sean utilizados de manera más eficiente?
El concepto de inspecciones se conoce por varios nombres dentro del sector público. En Chile se conoce como fiscalización, en Estados Unidos como problema de inspección, en México se le denomina auditoría, y en algunos países de Centroamérica se le llama verificación.
Este tipo de proyectos de ciencia de datos se caracterizan por recursos limitados: el gobierno u organización tiene una gran cantidad de datos por revisar pero cuenta con un conjunto limitado de recursos para verificarlos. Derivado de ello, se plantea la siguiente pregunta, ¿cómo identificar de una lista inmensa de cosas por inspeccionar o fiscalizar, las de mayor riesgo, o las que tienen mayor probabilidad de incumplirse, para hacer que los recursos alcancen y sean utilizados de manera más eficiente?
Como ejemplo, algunas problemáticas sobre las que hemos trabajado, son:
- ¿Cómo verificar si las empresas están cumpliendo con el reglamento laboral?
- ¿Están apegándose a la normativa de transparencia?
- ¿Las empresas están cumpliendo con las medidas de mitigación de la polución?
- ¿Cómo verificar que las escuelas tengan las condiciones adecuadas?
- ¿Cómo verificar que el gasto de las entidades de gobierno esté cumpliendo con la regulación?
Todos estos ejemplos tienen un denominador común, el número de entidades a revisar es muy superior al de quienes verifican.
La labor de la ciencia de datos y del machine learning en estos ejemplos, es la de priorizar los recursos. El nombre técnico de la fiscalización, desde el punto de vista de machine learning, se refiere a cómo priorizar los recursos, sin embargo, esta debe ser una priorización proactiva. Muchas empresas y organizaciones actúan de manera reactiva, respondiendo solo cuando sucede algo y reaccionando hasta ese momento para corregirlo, si es que se puede. Acá el objetivo es planear la inspección para evitar que ocurran infracciones en el futuro.
Métricas, objetivos y metas
Uno de los grandes problemas en muchas disciplinas, son las métricas y la definición de las metas. Estas por lo general no están bien entendidas por las organizaciones y este es un problema difícil que ha sido discutido intensamente en varios artículos desde el Harvard Business Review hasta el MIT Magazine. A las organizaciones les cuesta muchísimo trabajo especificar qué métricas, metas u objetivos quieren lograr.
Pensando en que somos transformadores de lo público y que generamos valor, si vamos a invertir en aprendizaje de máquina o sistemas de machine learning, debemos hacer el trabajo de la mejor manera, por lo que es esencial revisar las métricas y la definición de las metas. El tema lo abordamos a fondo en el curso Inspecciones Proactivas con Ciencia de Datos.
En él veremos cómo aplicar machine learning a un problema de inspecciones, cómo integrarlo, cómo medirlo, cómo saber si está funcionando el proceso y así revisar los impactos inequitativos.
Suele pensarse que no hay un impacto inequitativo porque no se interactúa con humanos directamente, sin embargo, siempre hay un humano al final de todos los sistemas que puede ser afectado, y debemos pensar en las personas desde el principio, plantear el problema, aplicarlo, integrarlo y medirlo de manera científica.
No te quedes fuera y súmate ahora al curso Inspecciones Proactivas con Ciencia de Datos. Inicio: 25 de agosto, obtén más información aquí.
Autor:
Actualmente es el Co-director académico del Diplomado Internacional en Ciencia de Datos para la Dirección Pública de la UAI y el TEC, y dicta el curso de Inspecciones Proactivas con Ciencia de Datos.