Fondo Chile, Out of the Box

By 22 de March de 2021 June 2nd, 2021 Uncategorized

Enriqueciendo el proceso legislativo mediante algoritmos de inteligencia colectiva.

Fondo Chile, Out of the Box

Enriqueciendo el proceso legislativo mediante algoritmos de inteligencia colectiva

Fondo

El fondo “Chile, Out of the Box” es un proyecto académico de investigación aplicada organizado conjuntamente por la Facultad de Derecho y la Facultad de Economía y Negocios de la Universidad de Chile, y el Banco Interamericano de Desarrollo. Este fondo pretende reunir ideas y perspectivas innovadoras de políticas públicas, con el fin de promover el desarrollo económico de Chile. En particular, el proyecto descrito se sitúa en la línea de trabajo de “Algoritmos para la toma de decisiones administrativas”.

Chile, Out of the Box

Objetivo

A través de la limpieza y el procesamiento de una amplia cantidad de comentarios disponibles en la plataforma, se busca diferenciar entre comentarios que poseen valor agregado de los que no lo poseen, utilizando el Procesamiento de Lenguaje Natural. La información que aporta un comentario relevante es útil ya que es aprovechada por los Senadores durante la discusión legislativa. Aquellos parlamentarios reciben un resumen con la información más novedosa obtenida de las opiniones de los usuarios de la plataforma,  con la intención de que este informe se convierta en un insumo básico de la discusión legislativa. Actualmente, este informe se realiza en forma manual por funcionarios públicos, y la intención del proyecto es extrapolar la identificación de comentarios valiosos ante próximos proyectos de ley, de manera automatizada.

Metodología

Para identificar el valor de un comentario, es necesario limpiar los datos a través de diferentes criterios como misspellings, stopwords, extensión mínima, entre otros. A partir de estos comentarios, se realiza un análisis de cluster mediante k-means, y se identifica el cluster que contiene al texto descriptivo del proyecto. Este cluster se utiliza como referencia de cercanía y con él se mide la calidad de los demás comentarios dependiendo de la distancia que los separa. Para clasificar los comentarios, a cada una de las distintas frases emitidas por los usuarios se le asigna un puntaje en función de la frecuencia exhibida por las palabras que la componen. Según estos puntajes que representan el valor del comentario, se realiza un resumen de cada cluster, uniendo las frases que contienen los mayores puntajes. Más adelante, se contrasta el resumen de los distintos clusters con respecto al que contiene el texto descriptivo del proyecto de ley, y de esta manera, se establece una ordinalidad entre ellos, dada por la distancia semántica de cada grupo.
En general, se espera que los comentarios más disímiles semánticamente al texto de referencia contengan información relevante o bien novedosa. De forma inversa,, aquellos comentarios más cercanos al cluster de referencia, se interpretan como cercanía al texto legislativo del proyecto. El objetivo de los experimentos, es encontrar el número de clusters que minimiza la varianza y que consigue que la serie se estabilice.

Resultados

Se logró interpretar grandes volúmenes de comentarios, los cuales permiten elaborar una idea representativa de las preferencias de los usuarios que comentan y se involucran en la plataforma. Esto muestra que sí es posible agrupar comentarios y generar resúmenes a partir de ellos. Sin embargo, no se pudo identificar comentarios de mayor relevancia para el proceso legislativo. El obstáculo más difícil de sortear, es mitigar la subjetividad subyacente en la clasificación de tipo “valioso/no valioso”. Traducir esto en instrucciones lógicas para alimentar el algoritmo de identificación no es algo trivial, dada la tecnología actual. Por estas razones, se pretende continuar con los experimentos actuales, revisar la metodología de resumen, estudiar la coincidencia de comentarios con respecto a profesiones y otros criterios, y completar un método de clasificación de manera supervisada.

Innovación con ciencia de datos al servicio de la sociedad

Revisa nuestros proyectos de investigación aplicada interdisciplinaria