euskaraespañol

UPV/EHUko Eneko Agirre irakasleak Google erakundearen ikerketa sarietako bat lortu du

Saria hirutan lortu duen ikertzaile bakanetakoa da

  • Ikerketa

Lehenengo argitaratze data: 2020/03/05

Eneko Agirre (argazkiaren erdialdean) eta azterlanaren lankideak. Argazkia: UPV/EHU

Eneko Agirrek, Euskal Herriko Unibertsitateko Informatika Fakultateko irakasleak, HiTZ ikerketa zentroko zuzendariak eta Ixa Taldea ikerketa taldeko kideak, urtero ematen diren Google Faculty Research Awards ikerketa arloko sarietako bat jaso du. Agirre irakasleak Aitor Soroa eta Gorka Azkune irakasleen, Arantxa Otegi ikertzailearen, Jon Ander Campos doktoretza ikaslearen, Aitor Agirre masterreko ikaslearen eta Eduardo Vallejo graduko ikaslearen laguntza izan du bere azterketan. Google lengoaiaren prozesamenduaren arloan 11 sari eman ditu. Guztira, 50 herrialdetako 330 unibertsitatek bidalitako 150 proposamen saritu ditu Googlek (Inteligentzia Artifizialaren arloko 18 arlotako 917 hautagai). Soilik% 25 Estatu Batuetatik kanpoko unibertsitateetatik datoz, eta hizkuntza naturalaren prozesamenduaren kasuan sari bakarra dago Europan. Eneko Agirre irakaslea saria hirutan lortu duen ikertzaile bakanetakoa da. Sariak 70.000 dolar ditu, eta 'Conversational Question Answering agents that learn after deployment' izeneko proiektua finantzatuko dute, erabiltzaileekin elkarreragiten duten bitartean ikasteko gai izango diren elkarrizketa-sistemak garatzeko.

Gaur egun Interneten dagoen informaziora Google edo Bing bezalako bilatzaileen bidez sartzen gara, eta bilatzen ditugun dokumentu garrantzitsuak itzultzen dizkigute. Hori aldatzen ari da, gure ahotsa ulertzen duten laguntzaile birtualen garapenari esker - Siri, Alexa edo Google Assistant aipatzen ditugu, besteak beste -. Laguntzaile horiek azkar ari dira jendarteratzen, dela mugikorren bidez, dela Amazon Echo edo Google Home bezalako bozgorailu adimendunen bidez, eta makinekin komunikatzeko dugun modua aldatzen ari dira. Gaur egun, gero eta aplikazio gehiago baina mugatuak daude, elkarrizketa bidez erabil daitezkeenak, neurri batean, makinek ez dutelako hizkuntzaren konplexutasuna ulertzen eta gure hizkuntzaren anbiguotasunean erraz galtzen direlako. Sistema horiek laborategian entrenatzen dira, eta haien kalitatea nahikoa denean erabiltzaileekin martxan jartzen dira.

Adimen artifizialeko tekniken bidez, saritutako proiektuaren helburua da elkarrizketa-sistemek erabiltzaileengandik ikasi ahal izatea, martxan daudenean. Horrela, errendimendua hobetu egingo da erabilerarekin, laborategian soilik entrenatu diren sistemak gaindituz. Erronka da detektatzea erabiltzaile bat noiz dagoen pozik sistemaren erantzunekin eta noiz ez, modu naturalean eta ez intrusiboan. Horretarako, ikerketa-taldeak bi pertsonaren arteko elkarrizketa-kopuru handiak bilduko ditu, non pertsona batek galderak egiten dituen eta beste pertsona batek dokumentu jakin batean dagoen informazioan oinarrituta erantzuten dion. Elkarrizketa horiek galderak egiten dituen pertsona noiz ase den eta noiz ez detektatzen duten eredu automatikoak entrenatzeko balioko dute. Datu multzo horren gaineko esperimentuek proposatutako teknikak laborategian baliozkotzeko balioko dute. Esperimentuek arrakasta badute, proposatutako sistemak egun ezagutzen ditugun chatbot askoren kalitatea hobetzen lagunduko du.

Proiektu hau aurreko urtean Googlek saritutako beste proiektu baten jarraipena da, non eremu zehatzei buruzko galdera-erantzuneko elkarrizketa-sistemak eraiki ziren. Emaitzak oso onak izan dira, ingelesez zein euskaraz, eta atariko emaitzekin argitalpen bana egin dute NeurIPS kongresuko elkarrizketa-sistemei buruzko mintegian zein LREC baliabideei buruzko kongresuan. Jasotako informazioa Hizkuntza Prozesamenduan Masterreko hainbat lanen fokua izango da datorren ikasturtean.

Proiektuaren ingelesezko elkarrizketen eremuetako bat sukaldaritzari eta elikadurari buruzko galderak dira, eta, horietan, honako elkarrizketa hauek jaso dira, foroan dagoen informazioan oinarrituta (ikus 1.irudia).

Proiektua batez ere ingelesezko elkarrizketetan zentratzen bada ere, euskarazko elkarrizketekin ere lan egin dute. Horretarako iaz Ixa taldeak euskarazko elkarrizketak biltzeko boluntarioak erakartzeko kanpaina jarri zuen martxan. Kanpainak oso harrera ona izan zuen, eta pertsonei buruzko euskarazko elkarrizketak jaso ziren, Wikipedian dagoen informazioan oinarrituta (2.irudian adibide bat ikus daiteke). Norbaitek kanpainarekin bat egin nahi badu, nahikoa da http://ixa.eus/lagundu helbidera sartu eta izena ematea.