La colaboración UAI-Sernapesca busca, en una primera instancia, mejorar el diseño y gestión de la labor de fiscalización de Sernapesca.
Convenio de Colaboración UAI - Sernapesca
La colaboración UAI-Sernapesca busca, en una primera instancia, mejorar el diseño y gestión de la labor de fiscalización de Sernapesca. El primer objetivo del proyecto fue crear un método para detectar embarcaciones fraudulentas a través de algoritmos de minería de datos para disminuir las evasiones en los reportes. El segundo proyecto de esta colaboración busca mediante ciencia de datos, la detección de bacterias en el fondo marino en centros de cultivo de salmónidos
El GobLab, de la Escuela de Gobierno de la UAI, contribuirá mediante la limpieza de datos, el análisis exploratorio de datos, el modelamiento de datos, Machine Learning/Minería de Datos, la evaluación de los modelos y el respectivo manual de uso, además de entregar un informe final del proyecto y el código de un modelo de detección de anomalías o predictivo que sea capaz de clasificar/determinar, con anterioridad, las embarcaciones que respetan y las que no respetan las cuotas establecidas.
Detección de evasiones a la fiscalización de las cuotas de pesca
Como problema por solucionar, se definió las evasiones a la fiscalización de las cuotas de pesca, las que ocurrían particularmente cuando eran del tipo documental, modalidad que primó durante la pandemia COVID debido a la imposibilidad de fiscalizar de manera presencial.
Entre los principales efectos que tenía esta practica era un aumento en los periodos de extracción de los barcos y el daño a la biodiversidad marítima.
Como solución, se propuso un sistema de banderas, el cual se sustenta en seis análisis estadísticos a los datos entregados por Sernapesca: 7,961 registros de descargas de 380 embarcaciones artesanales, clasificados por: ID del barco, tipo de fiscalización, tonelaje de pesca para cinco tipos de peces distintos y capacidad de bodega.
Así, tras la realización de más de 2,000 test de hipótesis, se pudo concluir que el tipo de fiscalización implica un cambio de comportamiento, tanto en frecuencia de descarga como en tonelajes reportados.
A partir de lo anterior, se diseñó como solución un sistema de banderas: se calcula para cada barco el porcentaje de banderas rechazadas por embarcación, siendo los barcos con mayor porcentaje los que presentan comportamiento sospechoso. Con esta información, Sernapesca genera un reporte y destina los recursos a la fiscalización de los barcos sospechosos.
Análisis de videos para detectar fondos marinos anaeróbicos en centro de cultivo de salmónidos
Gracias a una secuencia de videos de bacterias del fondo marino, previamente clasificados por Sernapesca, se pudo entrenar un modelo para predecir la aparición de bacterias. Existía un problema de clasificación, había que clasificar imágenes para poder entrenar un modelo. En una primera instancia esto se hizo manualmente, analizando muchas secuencias de video una por una y catalogando dónde aparece la bacteria y en qué tiempos en particular aparece, pero surgió otro problema, la aparición de la bacteria es muy breve a lo largo del video.
El siguiente paso fue evaluar los resultados, estos debían ser transformados para indicar cuando hay bacterias y cuando no las hay. En la fase de entrenamiento se tenían imágenes con bacterias e imágenes sin esta, de esta manera se pudo entrenar una base de datos con una gran cantidad de imágenes con y sin bacterias.
La red neuronal permite entrenar datos que son realmente complejos, si usáramos metodologías clásicas de machine learning no seríamos capaces de detectar esto porque las imágenes tienen condiciones muy distintas entre una y otra.
El mejor rendimiento que obtuvimos fue de una precisión del 91% y una precisión de validez del 87%.
El algoritmo predice en las imágenes la presencia o no de la bacteria. Pero el algoritmo se puede equivocar, es por esto que el algoritmo entrega una probabilidad de que aparezca la bacteria. Una vez que se determina esta probabilidad, se define un umbral, sobre cierto umbral o bajo cierto umbral está o no está.
Podríamos pensar que el clasificador se equivoca, pero lo que hacemos es tomar una secuencia de tiempo que llamamos sliding window, en esa secuencia podemos capturar los últimos frames de video y luego clasificar según probabilidad de presencia o no. No se clasifica un frame o una imagen, en realidad es una secuencia temporal de imágenes.
Es clave encontrar esta bacteria porque tiene relación con lo que está sobre el lecho marino y la contaminación. El output de nuestro demo es que finalmente nosotros podemos decirle a Sernapesca en qué segundo o en qué momento del video hay presencia de la bacteria beggiatoa, de esta manera los funcionarios de Sernapesca no deben revisar todo el material, sino que pueden dirigirse a los frames señalados por el algoritmo, lo que genera un ahorro de tiempo al fiscalizador y una mejora en sus procesos internos.
Nuestro equipo
-
José Castillo
-
Sebastián Moreno
-
Rodrigo Martínez
-
Nicolás Martínez
-
Miguel Carrasco
-
María Paz Hermosilla
-
Claudio Aracena
Presentación del estudio
(Español) ¿Cómo formulamos proyectos de IA y ciencia de datos que resuelvan problemas públicos?
via Zoom
Innovación con ciencia de datos al servicio de la sociedad
Revisa nuestros proyectos de investigación aplicada interdisciplinaria