Corpus Historikoa (CH)
—2000. urtera bitarteko corpusa—
denera: 72,5 milioi testu-hitz
garaia: 1545/2000
lehen argitaraldia: 2019-03-18
lemak: 94.981
hitz desberdinak: 1.990.395
2.641 liburu/aldizkari
Egileak: Ibon Sarasola (Euskal Herriko
Unibertsitatea UPV/EHU), Pello Salaburu
(Euskal Herriko Unibertsitatea UPV/EHU),
Josu Landa (Ametzagaiña).
ISBN: bidean
-
Besterik gabe, lemak bilatzen dira. Lemaren lehen letrak idazten hasita, hasiera hori duten lemen zerrenda ageri da:
bukatu
“bukatu” lemaren forma guztiak aintzat hartuko dira.
-
Hitz edo forma soila bilatu nahi bada, aurretik itsatsita marratxoa (“-”) ipini. Adibidez:
-bukatzerakoan
-
Hasiera zehatz bateko hitz edo forma guztiak bilatu nahi badira, amaieran itsatsita izartxoa (“*”) ipini. Adibidez:
-bukatze*
“bukatze” hasiera duten hitz guztiak kontuan hartuko dira.
Oharra: izartxoa erabiltzeak asko moteltzen du bilaketa.
-
Hitz edo lemen segidak ere bila daitezke. Adibidez:
-bukatutzat eman
“bukatutzat” hitza eta ondoren “eman” lema duten kateak bilatuko dira.
-
Hitz edo lema horien arteko gehienezko distantzia ere zehaztu daiteke, tartean zenbaki bat idatziz:
-bukatutzat 3 eman
“bukatutzat” hitzaren eta “eman” lemaren artean bi hitz egon ahal izango dira.
-
Lemak elkarren artean erka daitezke, “|” zeinuaz banatuta. Adibidez:
bukatu | amaitu | bururatu
“bukatu”, “amaitu” eta “bururatu” lemen emaitzak batera bistaratzen dira. Gehienez, lau lema idatzi.