Egungo Testuen Corpusa (ETC)
—21. mendeko ereduzko corpusa—
denera: 355,4 milioi testu-hitz
garaia: 2001/2019
hirugarren argitaraldia: 2021-02-15
bigarren argitaraldia: 2016-05-06
lehen argitaraldia: 2013-03-11
lemak: 93.418
hitz desberdinak: 3.081.228
Egileak: Ibon Sarasola (Euskal Herriko
Unibertsitatea UPV/EHU), Pello Salaburu
(Euskal Herriko Unibertsitatea UPV/EHU),
Josu Landa (Ametzagaiña).
ISBN: 978-84-693-9891-3
-
Besterik gabe, lemak bilatzen dira. Lemaren lehen letrak idazten hasita, hasiera hori duten lemen zerrenda ageri da:
bukatu
“bukatu” lemaren forma guztiak aintzat hartuko dira.
-
Hitz edo forma soila bilatu nahi bada, aurretik itsatsita marratxoa (“-”) ipini. Adibidez:
-bukatzerakoan
-
Hasiera zehatz bateko hitz edo forma guztiak bilatu nahi badira, amaieran itsatsita izartxoa (“*”) ipini. Adibidez:
-bukatze*
“bukatze” hasiera duten hitz guztiak kontuan hartuko dira.
Oharra: izartxoa erabiltzeak asko moteltzen du bilaketa.
-
Hitz edo lemen segidak ere bila daitezke. Adibidez:
-bukatutzat eman
“bukatutzat” hitza eta ondoren “eman” lema duten kateak bilatuko dira.
-
Hitz edo lema horien arteko gehienezko distantzia ere zehaztu daiteke, tartean zenbaki bat idatziz:
-bukatutzat 3 eman
“bukatutzat” hitzaren eta “eman” lemaren artean bi hitz egon ahal izango dira.
-
Lemak elkarren artean erka daitezke, “|” zeinuaz banatuta. Adibidez:
bukatu | amaitu | bururatu
“bukatu”, “amaitu” eta “bururatu” lemen emaitzak batera bistaratzen dira. Gehienez, lau lema idatzi.
-
Aurreko bi aukerak konbinatzerik ere badago. Adibidez:
-bukatutzat 3 eman | eman 3 -bukatutzat