Sesgos en detección de Covid-19 mediante rayos X: Los potenciales riesgos de no aplicar una mirada ética en el uso de sistemas automatizados en el sector salud

By 13 de June de 2023 June 18th, 2023 Algoritmos Éticos, Blog

La importancia de aplicar la ética algorítmica al usar sistemas de decisión automatizada cobra mayor relevancia en áreas tan sensibles como la salud.

19 de junio 2023

Sesgos en detección de Covid-19 mediante rayos X: Los potenciales riesgos de no aplicar una mirada ética en el uso de sistemas automatizados en el sector salud

La importancia de aplicar la ética algorítmica al usar sistemas de decisión automatizada cobra mayor relevancia en áreas tan sensibles como la salud. Un ejemplo concreto lo entrega el estudio que realizamos en el marco del proyecto Algoritmos Éticos, Responsables y Transparentes en colaboración con la Facultad de Ingeniería y Ciencias UAI, que mostró un manejo sesgado de bases de datos para machine learning que podría generar errores en el diagnóstico del Covid-19. Una investigación extrapolable a otros usos de inteligencia artificial que les invitamos a conocer.

La pandemia del Covid-19 desató en el año 2020 la necesidad urgente de lograr la detección temprana de la infección para poder obtener los mejores resultados posibles en el combate del virus. La demora en los resultados de los test hizo buscar y usar otras tecnologías más rápidas, una de ellas fue el uso de imágenes de tórax por rayos X de potenciales pacientes contagiados, las cuales fueron evaluadas por sistemas de decisión automatizada (SDA) para lograr un diagnóstico inmediato y certero… o eso fue lo que se pensó en un primer momento.

En medio de este panorama, comencé en la Universidad Autónoma de Manizales (Colombia) un proyecto que contó con la participación de países como España, EE.UU. y Francia para analizar la eficacia de estos diagnósticos. Tras procesar 19 bases de datos con imágenes de rayos X obtuvimos que la precisión era del 96,19%.

Sin embargo, no fue hasta que vine a Chile y me integré al proyecto Algoritmos Éticos, Responsables y Transparentes -iniciativa de la Universidad Adolfo Ibáñez (UAI) que cuenta con apoyo de BID Lab- y empecé a colaborar con el profesor Gonzalo Ruz de la Facultad de Ingeniería y Ciencias (FIC) de la UAI, y Daniel Arias y Joshua Bernal, de la Universidad de Manizales, que empezamos a analizar las bases de datos de dicho trabajo con una perspectiva de equidad y responsabilidad, entre otros principios de la ética de los datos, y descubrimos los problemas que presentaba este modelo de diagnóstico.

Así, el estudio inicial evolucionó y se convirtió en una nueva investigación con la que volvimos a revisar las bases de datos con la herramienta Aequitas y logramos publicar el paper “Sesgos asociados a la estructura de base de datos para la detección de Covid-19 mediante rayos X”.

Esta investigación determinó que en algunos casos el machine learning -o aprendizaje automático- del SDA fue sesgado porque no incorporó la información básica respecto de cada paciente, como edad, sexo y características demográficas, entre otras, lo que en una estructura de datos más grande podría conducir a errores.

Otro punto relevante detectado fue que las radiografías provenían de distintos tipos de máquinas y tecnologías, lo que implicó que en una misma base de datos se unian exámenes de muy dispares calidades de imagen, lo que influyó en que el diagnóstico realizado por el SDA pudiera estar más bien determinado por la calidad de la imagen que por la presencia de Covid-19 en ella.

La publicación del estudio pretende, ya pasada la urgencia por obtener resultados, evitar posibles errores en SDA de este tipo, colocando una señal de alerta respecto del cuidado que se debe tener cuidado con las bases de datos en las que se trabajan y ser conscientes de que siempre es posible que existan sesgos que, al ser detectados, deben ser minimizado para obtener buenos resultados.

Finalmente, invitamos a extrapolar este análisis ético del uso de SDA en la detección del Covid en imágenes de rayos X a otras aplicaciones de inteligencia artificial y algoritmos, tanto en salud como en otros ámbitos sensibles para las personas, para así evitar efectos indeseados en su aplicación.

Reinel Tabares es cientista de datos e investigador postdoctoral del proyecto Algoritmos Éticos, Responsables y Transparentes.

Autor:

Reinel Tabares

Cientista de datos e investigador postdoctoral del proyecto Algoritmos Éticos, Responsables y Transparentes.

Cientista de datos e investigador postdoctoral del proyecto Algoritmos Éticos, Responsables y Transparentes.