Euskal Hiztegiaren Maiztasun Egitura (EHME)
Euskal Hiztegiaren Maiztasun Egitura (EHME)
[argibide gehiagorako,
ikus Aplikazioa zuzen erabiltzeko ohar batzuk]
Aplikazio honek euskal hiztegiaren hainbeste maiztasun datu jarri nahi ditu erabiltzaileen eskura. Corpusetik erauzitako datuak dira, eta hainbeste elementu kontsideratzen ditu:
- Hitzaren maiztasuna.
- Hitzaren egitura ortografikoa: letra kopurua, silaba kopurua, CV egitura, silaba egitura...
- Hitzaren auzokideak: letra bat aldatuz, kenduz, gehituz....
- Silabak, letra bikoteak eta hirukoteak; haien kokapena hitzaren barnean.
- Morfologia: lema eta bere maiztasuna, kategoria gramatikala...
Maiztasun datuok lortzeko erabili den corpusa Ereduzko Prosa Gaur (EPG) izan da. Hala ere, lexiko arrunteko hitzak bakarrik hartu dira aintzat, lemaren bat atxikita dutenak. Bazter utzi dira izen propioak, beste hizkuntzetako hitzak, erratuak, eta abar. Horren ondorioz, EPGn 25,1 milioi testu-hitz baldin badira, egitura honetan 22,7 milioi testu-hitz izan dira erabilitakoak.
Maiztasun egiturarako sarbidea hiru modutara egin daiteke:
- Datuak: Datubaseko datu orokorrak.
- Datuetatik hitzetara: Hainbeste irizpide erabakita, irizpideok betetzen dituzten hitzen zerrenda itzultzen du bilaketak.
- Hitzetatik datuetara: Hitz zerrenda bat idatzita, hitz horiei buruzko maiztasun datuak itzultzen ditu bilaketak.
- Lemetatik datuetara: Lema zerrenda bat idatzita, lema horiei buruzko maiztasun datuak itzultzen ditu bilaketak.
Abiatze data: 2011-02-04
Datu-basea osorik, MySQL formatuan [8,7 Mb]
Acha, J.; Laka, I.; Landa, J.; Salaburu, P. (2014) EHME: A new word database for research in Basque language. The Spanish Journal of Psychology, ISSN: 1138-7416 EISSN: 1988-2904.
Egileak: Josu Landa (Ametzagaiña), Ibon Sarasola (Euskal Herriko Unibertsitatea UPV/EHU), Pello Salaburu (Euskal Herriko Unibertsitatea UPV/EHU).
ISBN: 978-84-693-9890-6
© 2011, Landa, Sarasola, Salaburu