Convenio de Colaboración UAI – Sernapesca

By 07 de July de 2021 Uncategorized

El convenio busca potenciar la labor de fiscalización de Sernapesca mediante el uso de Ciencia de Datos.

Convenio de Colaboración UAI - Sernapesca

El convenio busca potenciar la labor de fiscalización de Sernapesca mediante el uso de Ciencia de Datos y de esta manera detectar el cumplimiento de las cuotas de pesca y la protección del recurso pesquero del país.

Detección de embarcaciones fraudulentas con Machine Learning

1. Limpieza de los datos

La limpieza de datos consistirá en tres procesos, extracción de características, limpieza de datos, y reducción de datos/variables. En la extracción de características se procederá a la generación de nuevos datos dada la base de dato actual, siendo posible hasta reemplazar los datos originales. En la limpieza de datos se procederá a eliminar datos ruidosos, antiguos, perdidos y/o duplicados. Finalmente, la reducción de datos/variables busca representar los datos en forma más compacta, permitiendo una mejor utilización para los futuros análisis.

2. Análisis exploratorio de datos

Este análisis permitirá maximizar el conocimiento de los datos adquiridos a través de la visualización de datos. Específicamente, se procederá a visualizar la distribución de cada variable permitiendo identificar variables importantes y generar nuestras primeras hipótesis para enfrentar el problema.

3. Modelamiento de los datos

Esta etapa determinará cómo enfrentar el problema en base a la información generada en las primeras dos etapas. Principalmente, se determinará si enfrentar el problema como análisis de outlier semi supervisado, o un problema de clasificación.

4. Machine Learning/Minería de datos

Se implementarán los modelos básicos de análisis de outliers o modelos de clasificación (según corresponda), y en caso de ser necesario, se procederá a generar un nuevo modelo.

5. Evaluación de los modelos

Se evaluarán los modelos implementados para estimar la distribución del error del modelo, según corresponda. Por ejemplo, en el caso que se modele como un problema de clasificación, se aplicará k-fold cross validation.

6. Manual de uso

Se procederá a la creación de un nuevo manual para que el modelo pueda ser reentrenado y aplicado en alguna nueva base de datos.

Título del proyecto

Descripción del proyecto

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Integer feugiat ac urna placerat commodo. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Quisque condimentum nulla sed nunc sodales, quis euismod diam interdum. Quisque vel turpis ipsum.

Innovación con ciencia de datos al servicio de la sociedad

Revisa nuestros proyectos de investigación aplicada interdisciplinaria

SANTIAGO: (+56 2) 2331 1000
Diagonal las Torres 2640, Peñalolén.
Av. Presidente Errázuriz 3485, Las Condes.

VIÑA DEL MAR: (+56 32) 250 3500
Padre Hurtado 750, Viña del Mar.

Certificados académicos

Síguenos: