inf_prosa-de-referencia

Ereduzko Prosa Gaur (EPG)

2000-2007 urteen artean idatzitako testuetan oinarritzen den erreferentzia corpusa. Denetara 25,1 milioi hitz biltzen ditu: 13,1 liburuetakoak (287 liburu) eta 12 milioi Iparraldean eta Hegoaldean argitaratzen den prentsatik hartua.

Corpus itxia da: hainbeste proba egin ondoren, eta kontuan izanik zertarako eta nork erabiltzen duen corpusa, ikertzaile taldeak erabaki du ez handitzea, hola ongi betetzen baitira helburuak. Corpusa handitzeak "zarata" ekarriko luke, adibide berriek ez bailukete garrantzizko informazio berririk ekarriko eta bai, ordea, nahasmendua. Euskara Institutuaren atarian badira, nahi izanez gero, beste corpus batzuk, baten bat ia hamar aldiz handiagoa.

Prosan idatzitako hitzen testuingurua zein den ikus daiteke corpus honetan. Hitza biltzen duen esaldi osoa ikus daiteke, zenbat aldiz ateratzen den (eta non, prentsan edo liburuetan), nork erabiltzen duen, eta non.

Corpus honetan oinarritu dira beste zenbait lan, institutuko webgunean ikusten ahal direnak: