Investigadoras del grupo IXA de la UPV/EHU colaboran con Osakidetza en la creación de un sistema de extracción automática de efectos adversos producidos por medicamentos recogidos en historias clínicas electrónicas escritas en castellano. Las investigadoras han realizado diferentes pruebas utilizando el machine learning y el deep learning, con el objetivo de conseguir un modelo robusto para la extracción de relaciones entre pares fármaco-enfermedad basado en la minería de textos clínicos.
Extracción automática de reacciones adversas a medicamentos de historias clínicas electrónicas
El grupo IXA de la UPV/EHU utiliza el procesamiento del lenguaje natural para extraer los efectos adversos de historias clínicas escritas en castellano
Fecha de primera publicación: 09/03/2021
Las historias clínicas electrónicas de los pacientes transmiten información crucial. La aplicación de técnicas de procesamiento del lenguaje natural a dichas historias puede ser una forma eficaz de extracción de información que podría mejorar la toma de decisiones clínicas, la documentación y la facturación clínica, la predicción de enfermedades, así como la detección de reacciones adversas a medicamentos. Este tipo de reacciones adversas son uno de los principales problemas de salud, que provocan reingresos hospitalarios e incluso la muerte de algunos pacientes. Un sistema de detección automática de reacciones adversas a medicamentos puede destacar dichas reacciones en un documento, resumirlas y también informar automáticamente.
En este contexto, el Hospital Universitario de Basurto y el Hospital de Galdakao “estaban interesados en crear un sistema que, a través de técnicas de procesamiento de lenguaje natural, pudiera analizar los historiales médicos para identificar automáticamente los efectos adversos que hay en ellos”, explica la ingeniera y doctora en informática Sara Santiso. Tras ponerse en contacto con el grupo IXA de la UPV/EHU, varias investigadoras se pusieron a trabajar para encontrar un modelo robusto con el que extraer los efectos adversos a medicamentos de historias clínicas electrónicas escritas en castellano basado en la minería de textos clínicos.
Para ello, “hemos utilizado, por un lado, técnicas basadas en algoritmos tradicionales de machine learning, y por otro lado, hemos explorado técnicas de deep learning, llegando a la conclusión de que con estas últimas se detectan mejor los efectos adversos”, explica Santiso, una de las autoras del estudio. Tanto el machine learning como el deep learning imitan la forma de aprender del cerebro humano, y difieren en el tipo de algoritmos que se usan en cada caso.
Dificultad para conseguir corpus en castellano
Santiso remarca la dificultad que han tenido para conseguir un corpus de tamaño adecuado con el que trabajar: “En un principio empezamos con pocos historiales médicos debido a que es difícil conseguirlos por la privacidad, ya que hay que firmar acuerdos de confidencialidad para trabajar con ellos”. Las investigadoras han observado que “contar con un corpus más grande ayuda al sistema a aprender mejor los ejemplos que había en ellos, y por lo tanto el sistema daba mejores resultados”.
Con este estudio llevado a cabo con historias escritas en castellano, “estamos contribuyendo a cerrar la brecha existente entre la minería de textos clínicos realizada en inglés con respecto a la realizada en otros idiomas, que cubre menos del 5 % de los artículos publicados. De hecho, la extracción de información clínica no ha alcanzado aún su pleno desarrollo debido, entre otras cosas, al potencial de extracción de información entre hospitales y entre idiomas”, afirma la investigadora.
Aunque el procesamiento del lenguaje natural ha sido de gran ayuda en la detección asistida por ordenador de las reacciones adversas a medicamentos, todavía hay margen de mejora: “Hasta ahora, los sistemas tienden a centrarse en la detección de pares medicamento-enfermedad situados en la misma frase. Sin embargo, las historia clínicas tienen información implícita que podría revelar relaciones subyacentes (por ejemplo, la información de los antecedentes podría ser relevante para adivinar las causas de un evento adverso). Es decir, la investigación debe esforzarse por detectar las relaciones entre frases, tanto las explícitas como las implícitas”. Además, otra cuestión a resolver para seguir con los estudios en el futuro es la falta de historias clínicas electrónicas escritas en castellano.
Información complementaria
Este estudio ha sido realizado por Sara Santiso, bajo la supervisión de las profesoras Alicia Pérez y Arantza Casillas, del grupo de investigación IXA de la UPV/EHU.
Referencia bibliográfica
- Adverse Drug Reaction extraction: Tolerance to entity recognition errors and sub-domain variants
- Computer Methods and Programs in Biomedicine
- DOI: 10.1016/j.cmpb.2020.105891