Software Teknologien Lantaldea (GTTS)
Saila(k) Elektrizitatea eta Elektronika |
||
Zientziaren esparrua(k) Konputazio Zientziak eta Teknologia Informatikoa |
||
Ikertzaile Nagusia (IN): Amparo Varona | IN-laguna: | |
Partaideak Germán Bordel García, Mikel Peñagarikano, Luis Javier Rodriguez Fuentes |
||
Hitz gakoak Eredu-ezagutzea, Hizkuntza/hiztun ezagutza, Hizkuntzen detekzioa, Azpititulazio Automatikoa, Hizkuntzaren Ezagutza Automatikoa, Datu-baseen Diseinua/Eskuraketa |
||
Deskribapena 2005. urteaz geroztik GTTSek garatzen du bere ikerketa-jarduera, eta ahotsaren prozesamenduan oinarritzen du bere ikerketa. 2010az geroztik, Eusko Legebiltzarrari zerbitzua ematen dio osoko bilkuretako bideoen azpitituluak jartzeko, akta ofizialen testua oinarri hartuta. Audio seinaleetan terminoak (testu edo ahots bidez zehaztuak) bilatzeko hobekuntza algoritmikoak garatzen lan egiten du, ereduak ezagutzeko tekniketan eta Deep Neural Networksen erabileran oinarrituta. Hizkuntza eta hiztuna egiaztatzeko sistemak garatu dira, NIST 2007, 2009, 2011, 2015, 2017 Language Recognition Evaluation eta NIST 2008, 2010, 2012, 2019 Speaker Recognition Evaluation nazioarteko lehiaketetan parte hartuz. Nabarmendu behar da 2019an GTTSk, Aholabekin batera, A ikerketa-talde egiaztapena lortu zuela Eusko Jaurlaritzaren deialdian (Aholab-GTTS: audioa, Speech and Language Processing Group). |
||
Ikerketa-Lerroak
|
||
Ekipamendua 6 kalkulu-zerbitzari, 9000 eta 47000 MFlops arteko gazitasunarekin, 24 eta 128 GB arteko memoria, guztiak CentOS sistema eragilearekin. GPUetan (4x) oinarritutako kalkulu zerbitzaria. Bi NAS/disko zerbitzari (40 TB-ko unitate nagusia eta 80 TB-ko backup unitate bat). Taldeak hizketarako datu base ugari ere baditu, batzuk bereak eta beste batzuk NIST ebaluazioen bidez edo LDC (Linguistic Data Consortium) harpidetzaren bidez lortutakoak. |
||
Web orrirako esteka |
Harremanetarako |