euskaraespañol

Eguneko irudia

Iñaki Alegria, Xabier Arregi, Xabier Artola, Arantza Diaz de Ilarraza eta Kepa Sarasola

Xuxenek 30 urte

Ixa taldeko hasierako ikertzaileak

  • Cathedra

Lehenengo argitaratze data: 2024/09/26

Ixa taldeko hasierako ikertzaileak | Argazkia: UPV/EHU.

1994ko irailaren 29an gizarteratu zen Xuxen, “euskararako lehen zuzentzaile ortografikoa”, biharamunean ‘Euskaldunon Egunkaria’n agertu zenez [1]. Lehen bertsio hori UPV/EHUko Ixa taldearen, UZEI terminologia-zentroaren eta Baionako Hizkia enpresaren artean ekoitzi zen. Bi disketetan zabaltzen zen, garaiko sistema eragileetara egokituta zegoen (Windows 3.0 eta Mac 7) eta bateragarria zen gehien erabiltzen ziren bi testu-prozesadoreekin (MS Word eta WordPerfect). Erabilpen profesionalera (administrazioa, itzultzaileak, idazleak...) zuzenduta zegoen eta, garaiko softwarearekin gertatu ohi zenez, garestia zen (deskatalogatuta dago orain, baina azken prezioa 84 €-koa zen). Arrakasta handia izan du gero urteetan zehar, bertsio berri asko sortu dira, eta euskaldunontzat xuxen hitza zuzentzaile automatikoaren sinonimoa da. Funtsezko tresna izan da eta izaten jarraitzen du euskararen normalizazioari begira, baita euskaraz ondo idazten ikasteko ere.

Oinarria

Euskarak duen konplexutasun/aberastasun morfologikoa dela-eta, hitz bat ondo idatzita dagoen ala ez erabakitzeko ezin zen, beste hizkuntza batzuetarako egiten zen bezala, hitz zerrenda batean oinarritu; lema batetik abiatuta sor daitezkeen forma onargarriak asko direnez, zerrenda izugarri handia izango bailitzateke. Hori dela-eta, Xuxen sortzeko hautatu zen bideak morfologia zuen ardatz eta egindako hurbilpena oso berritzailea izan zen teknologia aldetik, zuzentzaile gehien-gehienak hitzetan oinarritzen baitziren, eta ez morfologian. Hala, analisi zuzenik ez zuen edozein hitz susmagarritzat jotzen zuen, eta, ondorioz, gorriz azpimarratzen zuen. Gainera, bi ezaugarri ahaltsu zituen [2]:

  • Proposamenak egiteko ohiko bideez gain (karaktere bat gehitzea, aldatzea edo ezabatzea), «ohiko akatsak» hartzen zituen kontuan. Horretarako, erregela morfofonologiko eta lexiko-sarrera berriak idatzi ziren.
  • Erabiltzailearen hiztegia. Hitz (lema) berriak gehitu zitezkeen hiztegi horretan eta, horri esker, aurrerantzean hitz hori ez ezik, haren flexio osoa ezagutuko zen, beste ezer egin beharrik gabe. Erabilpen teknikorako oso garrantzitsua den ezaugarria eta, zoritxarrez, gaur egungo sistemetan integratzen ez dena.

Ixa taldeak lideratutako lana izan zen hura, estrategia eta bi doktoretza-tesi garatu ziren lan-ildo horretan: Miriam Urkiarena linguistikan eta Iñaki Alegriarena informatikan.

Bertsioak eta erabilpena

Egindako bertsioen eta egokitzapenen zerrenda luzea da, teknologikoki zein linguistikoki [3]. Hasierako disketeetatik CDetan banatzera pasatu zen (‘Euskaldunon Egunkaria’k Xuxen III banatu zuen CD batean, 2001ean). Eusko Jaurlaritzak Microsoftekin akordioa bideratu eta gero, enpresa horretako ofimatika-paketeetan integratuta zetorren, eta dena errazagoa zen. Eleka-Elhuyarrek egindako lanari esker, web bidez deskargatzeko aukera zabaldu zen, eta beste enpresa batzuetako aplikazioetan integratuz joan da [4]. Elhuyar da gaur egun lizentzia duena, eta lan handia egiten du webgunea mantentzen eta bertsio berriak prestatzen behar berriei begira.

2006an software libreko bertsioa ere etorri zen, nahi baino beranduago izan bazen ere, morfologikoki konplexuak diren hizkuntzei begira ordura arte zeuden soluzio estandar integragarriak desegokiak zirelako. Hungariatik proposatutako ‘Hunspell’ estandartzat hartu zenean, berriz, dena erraztu zen: paradigma kopuru handia onartzen zuen, baita bi atzizki kateatzea ere (bi baino ez, ordea). Baldintza horiei esker, zuzentzaileak lehenago zituen eragozpenak saihestu ahal izan ziren, neurri onargarri batean gutxienez. Eta hala, Firefox eta Thunderbird programek, eta beste askok, euskara ere zuzendu ahal izan zuten behingoz.

Xuxen etengabe haziz joan da linguistikoki lexikoaren aldetik, hasierako 60.000 hiztegi-sarrerak (lemak eta morfemak) bikoiztu egin dira, eta egokitzapenak izan ditu lexikoan eta sistema morfologikoan, Euskaltzaindiak hartutako erabakiekin bat etortzeko. Lan hori modu sistematikoan egin da Ixa taldearen eta Elhuyarren artean.

2009an, Xuxenen bertsio berezi bat sortu zen bizkaierarako, Ixaren eta Eleka-Elhuyarren artean, Labayrurekin lankidetzan. Datu-basean forma berriak sartu ziren lehenetsitako estandarrekin lotuta (‘deutso-dio’, ‘uri-hir’i, ‘gitxi-gutxi’...), eta hautazko erregela morfofonologiko berriak gehitu ziren morfemetan eta azalean aldaketak eragiteko. Arrakasta mugatua izan da, "bizkaiera estandarra" ez dagoelako behar bezain ondo definituta, besteak beste.

Xuxen ez da, gaur egun, euskararako zuzentzaile bakarra. Badaude Xuxen ez diren ‘xuxenak’, hala nola Hobelex (UZEIk kaleratua eta hasierako ezagutza berean oinarritua) eta multinazionalek gaur egun eskaintzen dituztenak. Microsoftena, esaterako, ez da Xuxen dagoeneko, eta Google Drivek ere berea du.

Eragina euskararen estandarizazioan

Hizkuntza idatzirako estandarrik gabe nekez egin daiteke kalitatezko zuzentzaile ortografiko bat. Zorionez, analizatzaile morfologikoa eta Xuxen egiten hasi ginenean eskura genituen Euskaltzaindiaren 1968ko Arantzazuko Batzarrak ekarritako ondorioak: baziren estandar bat osatzen ari ziren testuak, hiztegiak, gramatikak... horietako asko herri-ekimenez sortuak. Informazio hori guztia funtsezkoa izan zen kalitatezko zuzentzaile bat egin ahal izateko epe ez oso luzean.

Xuxenen erabilerak eragina izan du urteetan zehar testuen kalitatean, eta ekarpen handia egin dio eta egiten dio hizkuntzaren estandarizazioari eta zuzentasunari. Beraz, estandarizazioak eta zuzentzaileak elkar elikatzen dute, eta mezu hori zabaldu dugu beste hizkuntza minorizatuetarako laguntza eskatu izan digutenean.

Bestalde, esan genezake euskal kulturan ere eragina izan duela, eta hainbat idazlek eta bertsolarik izan dute hizpide. Anjel Lertxundi da, haien artean, nabarmenena: hainbat zutabe eskaini dio programari, eta hainbat liburutan izan du hizketagai. Haren azken liburuan, ‘Berbelitzen hiztegia’, hauxe da kapitulu baten izenburua: “Xuxen ibili Xuxenekin”.

Zuzentzailearen eragin positiboa kualitatiboki ezaguna izan arren, interesgarria litzateke eragin horretan gehiago ikertzea, oso garrantzitsua izan daitekeelako aipatutako beste hizkuntza horien suspertzeko garaian.

Etorkizuna

Hizkuntza-teknologiaren arloko azken berrikuntza testua sortzeko gai diren sistema neuronalek ekarri dute. Giza idazleek ez ezik, makinek ere testua sortzen dute, eta tresna horiek gero eta gehiago erabiltzen dira. Automatikoki sortutako testuen zuzentasuna zaindu ezean, euskara idatziaren kalitateak behera egin dezake. Hori horrela, zuzentzaileen beharra are eta nabarmenagoa da. Teknologia horretan ere gaur egun posiblea da estilo-zuzentzaile eraginkor bat eraikitzea.

2023ko abenduan plazaratutako xuxenen bertsioak zuzenketa ortografiko eta gramatikalak proposatzeaz gain, genero-ikuspegia ere kontuan hartzen du [5]. Zuzentzailea oso arrakastatsua da (adib., xuxen.com webguneak 491.105 bisita izan ditu 2023 urtean), baina ez du etorkizuna ziurtatuta. Hasieran eta urteetan zehar erakundeen babesa eta laguntza izan badu ere, gaur egun ez du laguntzarik eta arrakastaz hil daiteke. Doako zerbitzuen kulturaren eraginez gerta liteke euskarazko softwarerik arrakastatsuena ezin bizirik mantentzea. Xuxen merezi duen babesaren bila dabil gaur egun.

 

[1] https://euskaldunon-egunkaria.berria.eus/hemeroteka.php?irudia=b&fetxa=1994-09-30&orria=010&hash=ZVRGQVJUeVNUbm5DNlVDenh2SXp2QT09

[2] https://zenodo.org/records/7927167

[3] https://eu.wikipedia.org/wiki/Xuxen

[4] http://xuxen.eus/eu/deskargatu

[5] https://www.elhuyar.eus/eu/prentsa-aretoa/kalean-da-xuxen-webgunearen-bertsio-berria