Bitxia iruditu zait Twitterren jasotako berri hau, @Ingumakeriak kontuaren bidez:
Twitterreko testuak automatikoki lantzeko hizkuntza-teknologien bidez: @IxaTaldea ren Tweet Normalization Workshop http://t.co/9o8GQ1dmQb
— Ingumak laborategian (@Ingumakeriak) September 2, 2013
Ixa Taldea EHUn hizkuntzaren prozesamendurako ikerketetan 1987an hasi zen eta harrezkero, askotariko ikerketetan hartu du parte. Lan-talde handia da: 32 informatikarik, 8 hizkuntzalarik, 2 ikerkuntzarako teknikarik eta administrari laguntzaile batek osatzen dute. Espero dugu aurten jarraipena ematea iaz hasitako elkarlan bideari, hainbat hizkuntza proiektutan (eta blog honetan kontatzea, noski…).
Sare sozialetan erabiltzen den hizkerak ahozkotasunaren erregistroa imitatzen du baina ez du simulatzen, forma berriak asmatu baitira ahozkoaren soinuak eta elementu paralinguistikoak adierazteko. Adibidez, inork ez du esaten ozenki “ederrrraaaaaaaaa”, baina hizkiak eta bereziki bokalak luzatzea adierazkortasunerako bide gisa erabiltzen da. Hori ez da hizkuntza-ingenieritzaren oso gustuko, zaildu egiten baitu hizkuntzaren interpretazio automatikoa.
Ixa Taldeak erronka bota du, hortaz, SEPLN 2013 kongresuan: Ezetz asmatu modua prozesamendu naturalerako sistemek sare sozialetan botatzen ditugun egitura eta forma bitxi horiek atzemateko!
Zorte ona opa diegu partaideei!