Grupo de Trabajo en Tecnologías Software (GTTS)
Datos generales
- Investigador/a principal
- María Amparo Varona Fernández
- Número de doctores/as
- 4
- Número de integrantes
- 4
- Correo electrónico
- amparo.varona@ehu.eus
- Página web
- (Abre una nueva ventana) http://gtts.ehu.es
Personal
- Germán Bordel García
- Mikel Peñagarikano Badiola
- Luis Javier Rodríguez Fuentes
- María Amparo Varona Fernández
Líneas de investigación
GTTS desarrollan su actividad investigadora desde hace más de 10 años y centra su investigación en el procesamiento de la voz: segmentación de audio, reconocimiento de la lengua, reconocimiento del locutor, transcripción automática del habla, recuperación de información (indexado y búsqueda en recursos multimedia), subtitulado automático y detección de términos hablados.
Desde 2010, GTTS presta servicio al Parlamento Vasco para el subtitulado de los vídeos de las Sesiones Plenarias a partir del texto de las actas oficiales. GTTS trata de mejorar la calidad de los subtítulos actuando sobre el decodificador fonético, el algoritmo de alineamiento y la ergonomía.
Además, el grupo dispone de un sistema de indexado y búsqueda de información en recursos multimedia (Hearch: http://gtts.ehu.es/Hearch/), diseñado y puesto en marcha en el marco del proyecto SABUESO (TIN2009-07446). Se está trabajando en incrementar su funcionalidad con la integración de los sistemas automáticos de verificación del locutor y de la lengua.
Oferta de transferencia e innovación
Equipamiento
- Equipamiento para cómputo y almacenamiento: equipos de adquisición de datos, servidores de cómputo intensivo y servidores de disco para almacenamiento masivo de datos, ubicados en una sala especial con doble unidad de aire acondicionado y baterías de respaldo.
- Entorno de desarrollo de aplicaciones de procesamiento del habla, escrito en Java, de código abierto, denominado Sautrela (http://gtts.ehu.es/TWiki/bin/view/Sautrela).
- Bases de datos de habla y otros recursos lingüísticos con las que estimar los modelos y evaluar los sistemas, obtenidos en su mayoría mediante suscripción al Linguistic Data Consortium (https://www.ldc.upenn.edu), siendo GTTS coordinador de la suscripción para toda la UPV/EHU (http://gtts.ehu.es/gtts/ldc/ldc.jsp).
- Puesto que el grupo ha participado en las NIST Language Recognition Evaluations (LRE) en 2007, 2009, 2011, 2015 y 2017, en las NIST Speaker Recognition Evaluations (SRE) en 2008, 2010 y 2012, en la NIST Speaker Recognition i-Vector Machine Learning Challenge en 2013-2014 y en la NIST Language Recognition i-Vector Machine Learning Challenge en 2015, dispone también de las bases de datos suministradas por el NIST para dichas evaluaciones (https://www.nist.gov/programs-projects/speaker-and-language-recognition). Estas bases de datos tienen especial relevancia en el área, ya que se utilizan como referencia para comparar sistemas y probar nuevas aportaciones.
Proyectos destacados
Título: Subtitulado automático de vídeos de sesiones del Parlamento Vasco usando las actas
Empresa / Administración financiadora: Parlamento Vasco, 6.000 €/año (aproximadamente)
Período-Duración: indefinido, desde julio de 2010
Responsable: Germán Bordel García
Título: Subvención General a Grupos de Investigación
Empresa / Administración financiadora: UPV/EHU (GIU 13/28, Evaluación ANEP), 37.000 €
Período-Duración: de diciembre de 2013 a noviembre de 2016
Responsable: Luis Javier Rodríguez Fuentes
Título: Subvención General a Grupos de Investigación
Empresa / Administración financiadora: UPV/EHU (GIU16/68, Evaluación ANEP), 12.000 €
Período-Duración: de marzo de 2017 a marzo de 2020
Responsable: María Amparo Varona Fernández