Egungo Testuen Corpusa (ETC)
—21. mendeko ereduzko corpusa—
denera: 269,2 milioi testu-hitz
garaia: 2001/2015
bigarren argitaraldia: 2016-05-06
[beheko datuak bigarren argitaraldi horri dagozkio]
hirugarren argitaraldia: 2021-02-15
lehen argitaraldia: 2013-03-11
lemak: 91.884
hitz desberdinak: 2.556.292
Eskerrak eman nahi dizkiegu corpus honen osaketan euren testuak eskuzabal eman dizkigutenei:
- Berria egunkaria
- Argia astekaria
- Goienkaria astekaria
- Herria astekaria
- Udako Euskal Unibertsitatea (UEU)
- UPV/EHUko Euskara Zerbitzua
- UPV/EHUko Argitalpen Zerbitzua
- UPV/EHUko Euskara Juridikoaren Ataria
- Elkar, Txalaparta eta Igela argitaletxeak
- Pausoka ekoiztetxea eta EITB
- Jakin aldizkaria
- Elhuyar Fundazioa
Hona corpusaren ezaugarriak, osaketari dagokionez:
|
|
46,6 | jatorrizkoa |
34,6 | itzulpena |
188,0 |
neutroa (ezin jakin bata edo bestea den) |
14,2 | 2001 |
14,3 | 2002 |
12,8 | 2003 |
16,9 | 2004 |
15,6 | 2005 |
18,1 | 2006 |
19,8 | 2007 |
20,0 | 2008 |
19,7 | 2009 |
16,4 | 2010 |
14,8 | 2011 |
13,8 | 2012 |
14,0 | 2013 |
13,7 | 2014 |
12,9 | 2015 |
32,2 |
neutroa (ezin jakin zein urtekoa den) |
Egileak: Ibon Sarasola (Euskal Herriko
Unibertsitatea UPV/EHU), Pello Salaburu
(Euskal Herriko Unibertsitatea UPV/EHU),
Josu Landa (Ametzagaiña).
ISBN: 978-84-693-9891-3
-
Besterik gabe, lemak bilatzen dira. Lemaren lehen letrak idazten hasita, hasiera hori duten lemen zerrenda ageri da:
bukatu
“bukatu” lemaren forma guztiak aintzat hartuko dira.
-
Hitz edo forma soila bilatu nahi bada, aurretik itsatsita marratxoa (“-”) ipini. Adibidez:
-bukatzerakoan
-
Hasiera zehatz bateko hitz edo forma guztiak bilatu nahi badira, amaieran itsatsita izartxoa (“*”) ipini. Adibidez:
-bukatze*
“bukatze” hasiera duten hitz guztiak kontuan hartuko dira.
Oharra: izartxoa erabiltzeak asko moteltzen du bilaketa.
-
Hitz edo lemen segidak ere bila daitezke. Adibidez:
-bukatutzat eman
“bukatutzat” hitza eta ondoren “eman” lema duten kateak bilatuko dira.
-
Hitz edo lema horien arteko gehienezko distantzia ere zehaztu daiteke, tartean zenbaki bat idatziz:
-bukatutzat 3 eman
“bukatutzat” hitzaren eta “eman” lemaren artean bi hitz egon ahal izango dira.
-
Lemak elkarren artean erka daitezke, “|” zeinuaz banatuta. Adibidez:
bukatu | amaitu | bururatu
“bukatu”, “amaitu” eta “bururatu” lemen emaitzak batera bistaratzen dira. Gehienez, lau lema idatzi.
-
Aurreko bi aukerak konbinatzerik ere badago. Adibidez:
-bukatutzat 3 eman | eman 3 -bukatutzat