Bilaketa aurreratua

Ogi apurrak

Ereduzko Prosa Gaur (EPG)

AZALPENA

EPG izeneko corpusean ikus dezakezu nola erabiltzen diren euskara modernoak hitzak beren testuinguruan. Hitz bat aukeratuz gero, hitz hori biltzen duen esaldia bistaratuko zaizu, eta aplikazioak emango dizkizu xehetasun guztiak: nork erabiltzen duen, nondik hartua den, eta abar.

Aukera hemen egin behar duzu:

Lemak edo hitzak nola aukeratu

Ezker aldean ikusten duzun laukitxoan idatzi nahi duzun hitza: hitz osoa izan daiteke (“etxetik”) edo lema bakarrik (“etxe”). Aukera zuk egin behar duzu: ezer ere zehazten ez baduzu lema aukeratzen du aplikazioak, irudian ikusten duzun gisan, eta lema bat (“etxe”, “ate”, “ikusi”, “gaur”, eta abar) idatzi behar duzu laukitxo horretan: berehala ikusiko dituzu lema hori biltzen duten hitz guztien esaldiak. Beraz, “etxe” idatzi behar da, “etxetik” idatziz gero ez baitu ezer ere aurkituko.

Laukitxo horren azpian dagoen bestea (Morfologia esaten duena), ez dugu kontuan izango oraingoz.

Baduzu aukera hitz bat baino gehiago bilatzeko ere: adibidez, jo dezagun nahi duzula mendi eta gain hitzak ageri diren lerroen (“mendi gainean”, “mendi ganetik”, “mendien gainean”, eta abar) informazioa nahi duzula. Orduan lehenbiziko laukitxoan “mendi” idatziko duzu, eta bigarrenean “gain”. Bigarrena ez da Morfologia esaten duena, baizik hurrengoa. Hitz bakoitzak, nolabait esateko, bi lauki ditu. Distantzia esaten duen tokian “1” jarri behar duzu: esan nahi du hitzak bata bestearen ondoren daudela. Bilatu ditzakezu “mendi horren gainean” edo “mendietako iratze meten gainetik”. Holakoetan distantzia aldatu behar duzu, “2” edo “3” (edo nahi dena), jarriz. Corpuseko datuetan baldin badira holako adibideak berehala bistaratuko dituzu.

Jakina, batzuetan milaka eta milaka datu prozesatu behar ditu, zer den eskatzen diozuna. Adibidez, etorri eta izan lemak aukeratzen badituzu, “etorri da”, “etorriko da”, “etorriko balitz”, “bagatoz”, “bazetorren”... adizki mota guztiak aterako zaizkizu: 22.186 aldiz, 10.813 esalditan bilduak. Makinak denbora gehiago beharko du horren berri emateko.

Hemen ikusten ahal duzu adibidea:

Behin hor zaudela, liburuetako adibideak bakarrik, edo prentsako adibideak bakarrik ikus ditzakezu, dagozkien erlaitzetan klik eginez.

Bilaketa hitzetan (ez lemetan) oinarritua egin dezakezu. Orduan, hitza aukeratuko du, ez lema: esaterako, agian interesaturik zaude “menditik” hitza bakarrik bilatzeko (ez “mendira”, “mendi” edo “mendiko”, baizik “menditik” bakarrik). Kasu horretan, lema esaten duen tokian hitza aukeratu behar duzu.

Noski, hor “mendi” bakarrik ere idatz dezakezu, baina orduan “mendi” hitza duten adibideak bakarrik bistaratuko zaizkizu (ez “menditik”, “mendira”...), hitz hori bakarrik –ez lema hori—aukeratu baiztuzu.

Corpusa mugatu

Interesa izan dezakezu hitz bat bilatzeko, baina ez corpus osoan, baizik egile baten kasuan bakarrik, edo halako urteetan argitaratutako liburuetan, edo itzulpenetan bakarrik, eta abar. Beste hitzetan esateko: ez dituzu corpusean ageri diren datu guztiak erabili nahi, baizik batzuk bakarrik. Demagun jakin nahi duzula “gura” hitza itzulpenetan ageri den. Kasu horretan lema bezala idatzi behar duzu “gura” eta Corpusa murriztu erlaitza zapaldu behar duzu. Ireki zaizun leihoan Itzuliak aukeratu behar duzu:

Eta orain Bilatu esaten duen tokian klik egin eta aterako zaizkizu adibide guztiak.

Morfologia

Morfologia izeneko laukitxo horri esker beste bilaketa mota batzuk egin ditzakegu hitzaren morfologian oinarrituta. Aski da horretarako irekitzen den leihoan bilatzen ari zaren morfologia datuak sartzea (koherentea behar duzu izan: aditza baldin bada, aditzari dagozkion kontuak bakarrik sartu, eta izena). Beti ere, nahi duzun aukera egindakoan, Ezarri eta Itxi botoiak sakatu behako dituzu.

Adibidez, “etorri” lema bilatuta, Morfologia aukera baliatuta, zehaztu dezakezu ea jokatu gabeko formak soilik nahi dituzun. Irekitzen den leihoan, Aditz motaren barruan, Jokatu gabea hautatuz gero, “etortzen” edo “etorria” ageriko zaizkigu, baina ez “dator” edo “gentozen”. Beste kasu batera, “datorkio” edo “zatozkit” bezalakoak soilik nahi badituzu, aski duzu morfologiaren leihoan, Aditz motaren barruan, NOR-NORI hautatzea.

Bide bera erabil daiteke beste ezaugarri morfologikoren bidez bilaketaren emaitzak murrizteko: aditzaren denbora edo pertsona, deklinabide kasua, numeroa, aurrizkiak eta atzizkiak, eta abar.

Maiztasun bilatzailea

Orain arte aipatutako guztia Corpus arakatzailea izeneko atalari dagokio, baina badira beste bi atal corpuseko informazioa eskuratu ahal izateko bidea ematen dizutena: Maiztasunak eta Hitz multzoak. Eskuinean goian dituzu atal batetik bestera pasatzeko estekak.

Maiztasun bilatzailea erabiltzeko egin behar duzun lehenengo gauza, eskaintzen zaizun laukitxoan hitz edo lema bat idaztea da (bakarra). Ondoren, testua bilatu hautaketan osagai bezala, bere horretan hasiera bezala edo amaiera bezala aukeren artean, idatzi duzuna zer den zehaztuko duzu.

Emaitza ordenatu aukeran maiztasunaz edo alfabetoaz nahi ote duzun hauta dezakezu.

Demagun “rtasun” amaiera duten lemak aurkitu nahi dituzula. Laukitxoan “rtasun” idatzi eta bukaera bezala bilatzen baduzu, zerrenda bat azalduko zaizu. Bistaratuko zaizun zerrendan, agerpen eta maiztasun kopuruez aparte, liburuxka eta lupa bana ikusiko dituzu. Liburuxkan klikatzen baduzu, obra bakoitzeko zenbat agerpen dagoen aurkituko dugu. Lupan klikatuta, berriz, liburu bakoitzeko adibideetara jo ahal izango duzu.

Tresnaren beste erabilera bat errimak aurkitzekoa izan liteke. Adibidez “artu” lema edo hitz bukaera bezala bilatuko bazenu, “artu”z bukatutako hitz zerrenda luzea aurkituko zenuke.

Hitz multzoak

Atal honen bitartez, hitzen arteko konbinatoria nolakoa den azter dezakezu. Tresnak hitzetan soilik bilatzen du, literaletan, eta ez lemetan. Emaitza bi eta hiru hitzeko multzoak dira. Erabaki dezakezu bilatzen duzun testua hitz hasiera edo hitz osoa ote den, eta baita multzoak ordenatzen irizpidea aukeratu ere. Hitzaren kokapena delakoan, bilatutako hitza multzoaren barruan non kokatuta egotea nahi duzun zehaztu dezakezu: non-nahi, multzo hasieran edo multzo bukaeran.

Eman dezagun jakin nahi duzula “alkandora” hitzak zer adjektibo edo aditzekin lotu izan ohi den. Horretarako aski duzu multzo hasierako kokapena hautatzea, maiztasunaz ordena daitezen agindu, eta hitza izeneko laukian “alkandora” idaztea. Emaitzan topatuko dituzu zeintzuk diren erabilienak: “zuri”, “huts”, “arrosa”, “urdin”, “jantzi”, “kendu”...

Kasu askotan hitz baten bikote/hirukoteen zerrenda luzeegia da, eta orria kargatzen arazoak eman ditzake; horregatik, hasieran 3 agerpenetik gorakoak soilik eskatzea gomendatzen dugu.

Azken ohar garrantzizkoa

Corpus honetaz aparte badira corpus gehiago, denak XX. Mendeko euskararenak: Ereduzko Prosa Dinamikoa (EPD) izeneko corpusak, adibidez, honen antz handia du, baina testuak gaurkotuagoak ditu. Ikusi, horretarako, ezkerreko zutabean dagoen informazioa.

Nodoa: liferay1.lgp.ehu.eus