El equipo liderado por el profesor Eneko Agirre obtiene uno de las ayudas de investigación de la Fundación BBVA
Fecha de primera publicación: 29/05/2019
La Fundación BBVA ha dado a conocer recientemente los proyectos seleccionados dentro del programa de Ayudas a Equipos de Investigaciones Científicas 2018, programa creado en 2014 y que tiene como objetivo impulsar la investigación básica, traslacional o aplicada en áreas de alto interés social. En esta edición ha concedido ayudas a 25 proyectos de vanguardia, de un total de 618 solicitudes, en cinco áreas: Biomedicina, Ecología y Biología de la Conservación, Economía y Sociedad Digital, Big Data y Humanidades Digitales.
En concreto, en el área de la Biga Data, uno de los 5 proyectos seleccionados, de un total de 97 solicitudes, es el proyecto liderado por Eneko Agirre, profesor del Departamento de Lenguajes y Sistemas Informáticos de la Facultad de Informática de la Universidad del País Vasco/Euskal Herriko Unibertsitatea (UPV/EHU). El objetivo principal de este proyecto es utilizar Deep Learning y grandes colecciones de texto para transferir el conocimiento que ya existe en procesamiento de textos en inglés a otros idiomas, de forma que mejore la comprensión de textos en español, catalán, vasco y gallego. Esta área de investigación denominada Procesamiento del Lenguaje Natural forma parte de la Inteligencia Artificial, ya que pretende que los ordenadores lleguen a entender el significado de los textos. Esta área ha producido aplicaciones muy populares tales como la traducción automática o la búsqueda en Internet. Actualmente, el inglés es el idioma que más recursos tiene, es decir, existen programas que analizan esta lengua y extraen de grandes flujos de texto el conocimiento necesario para una aplicación en concreto. Este equipo de investigación quiere extrapolar esta compresión al español, catalán, vasco y gallego.
Eneko Agirre, investigador principal de este proyecto, explica que actualmente hay grupos de investigación y multinacionales a nivel mundial que están desarrollando aplicaciones que, mediante el análisis de flujos de Twitter y noticias, entienden qué se dice sobre un producto, empresa o partido político. Por ejemplo, analizando las últimas noticias sobre un accidente aéreo en tiempo real a lo largo de un periodo de tiempo, la computadora podrá comprender si el principal causante es la compañía aérea o la constructora de aviones. En el campo biomédico se analizan artículos científicos e informes médicos y la máquina descubre reacciones adversas a medicamentos o relaciones entre síntomas y enfermedades que no se conocían. En ambos casos, la agregación a partir de grandes volúmenes de datos permite distinguir el conocimiento del resto de la información no relevante. Este proyecto permitirá que esos algoritmos, que hasta ahora funcionan únicamente con el inglés, puedan utilizarse para el español, catalán, vasco y gallego.
Equipo investigador
German Rigau Claramunt; Rodrigo Agerri Gascon; Nora Aranberri Monasterio; María Jesús Aranzabe Urruzola; Arantza Díaz de Ilarraza Sánchez; Itziar Gonzalez Dios; Gorka Labaka Intxauspe; Maite Oronoz Anchordoqui; Mikel Artetxe Zurutuza; y, Olatz Perez de Viñaspre.