Víctor Etxebarria Ecenarro

Adimen artifiziala, denontzat irekia ala gutxi batzuen onurarako itxia?

Zientzia Fisikoetan doktorea eta Sistemen Ingeniaritza eta Automatikako katedraduna. Zientzia eta Teknologia fakultatea

Cathedra

Lehenengo argitaratze data: 2025/02/24

Artikulu hau jatorriz The Conversation argitalpenean aurki daiteke.

80ko hamarkadaren hasieran, gurasoek etxeko ordenagailu bat ekarri zuten gure etxera, telebistaren pantailara konektatzeko. Horrek zientzialari izatera "jolasteko" gogoa piztu zuen nigan. Lehenengo informatika aldizkari haietan, nire helburua zen argitaratzea funtzio matematikoak nola marraztu, mikroprozesadorearen makina kodea nola monitorizatu edo animazio eta ordenagailu joko errudimentarioak nola egin azaltzen zuten programa sinpleak, eta harrotasunez betetzen ninduen horrek.

Den-dena argitaratzen zen, lana egiteko moduaren azalpen xehea eta programaren iturburu kode osoa barne, edonork erraz kopia, proba, uler, erreproduzitu eta alda zezan, zernahitarako. Hori da zientzia irekiaren bertsiorik oinarrizkoena, enpresa unibertsal, kolektibo eta metagarri gisa ulertua.

Zientzia irekiaren printzipioak

Zientzia irekiaren xedea da prozesu zientifikoaren etapa guztiak gardenak eta besteentzat eskuragarri izatea. Horren barruan sartzen da, adibidez, ikerketa artikuluak argitaratzea, ikerketaren datu, metodo zehatz, esperimentu eta oinarri teoriko eta praktikoekin, bai eta ikerketa errepikatzeko behar den edozein informazio edo tresnarekin ere.

Helburuak dira erreproduzigarritasuna ahalbidetzea, elkarlana sustatzea eta aurretiazko ezagutzen gainean eraikitzea, ezagutzan aurrera egiteko. Hori funtsezkoa da ikerketa zientifikoa sinesgarria, etikoa eta eskuragarria izan dadin eta, zientzia irekiaren bidez, berrikusi, baliozkotu eta garatu ahal izan dadin.

Zer gertatzen da AArekin?

Edozein diziplinatan bezala, soilik adimen artifizialera irekitako zientziak bermatzen ditu erreproduzigarritasuna, gardentasuna eta, ondorioz, haren garapen publikoa eta elkarlanaren eta metaketaren printzipioekin koherentea izango den erabilera, gizateriaren onura xede.

Konputazio zientzien ikerketan diharduten ikertzaile gehienak ados daude beren ikerketa emaitzak printzipio horiei jarraiki argitaratzearekin. Kode irekia da aurrerapen zientifikoa bultzatu nahi duen edozein tresna informatikoren elementu garrantzitsuenetako bat -ez, ordea, bakarra-.

Jakintza arlo horretako espezialistek sortu dituzte irabazi asmorik gabeko hainbat erakunde, zehatz-mehatz definitzeko zertan datzan beren eremuko ikerketa eta garapena.

Adibidez, 1998an sortu zen Kode Irekirako Ekimena (Open Source Initiative, OSI), eta haren kode irekiaren definizioa (open source) da nazioarteko estandar onartuena.

Programa bat kode irekikotzat hartzeko, ez da nahikoa programa konpilaturako sarbidea erraztea, eta iturburu kode osoa ere eskaini behar du. Kontuan izan behar da azken hori -goi-mailako lengoaia ere esaten zaio- dela pertsona batek irakurtzeko moduko programazio lengoaia batean idatzitako programa bat. Aldiz, kode konpilatua -edo makina lengoaia- da fitxategi bitar batean eginiko iturburu kodearen itzulpena, zirkuitu elektroniko batek exekuta dezakeena, baina pertsona batek uler ezin dezakeena.

Kode irekiaren beste baldintza bat da kodea aldatu eta birbanatu ahal izatea, termino berberetan eta erabilera guztietarako, komertziala barne.

Enpresa teknologikoen kasua

Ez dira gutxi aberastasuna sortu, gizartearentzat onuragarriak izan eta gizartetik onura ere ateratzen duten enpresak. Hala ere, oso gutxik inbertitzen dute ikerketan, inbertsioa berreskuratuko dutela uste ez badute behintzat.

Ohikoa da konpainia teknologiko pribatuek zergadunek ordaindutako ikerketa publikoa aprobetxatzea eta etekin handiak ematen dizkieten produktuak sortzeko erabiltzea. Mariana Mazzucato ekonomialariak adibide paradigmatiko bat aipatu ohi du: Appleren iPhone.

Adimen artifizialean diharduten enpresen kasuan, errealitate hori are deigarriagoa da. Normala izan daiteke haien produktuak sortzea oinarri hartuta aurretik argitaratutako besteren ideiak eta ikerketak, baina kontua da AA eredu aurreratuenak kutxa beltz guztiz iragazgaitzak direla: ez da azaltzen haien barne logika, ez dira bermatzen haien funtzionamendua eta ekitatea, eta ezin da aztertu iturburu kodea.

Produktu ezagunenetako askok -hala nola Metaren ChatGPT edo SeamlessM4T itzultzaile modernoa- ezaugarri arbuiagarri horiek dituzte, zientzia irekiko artikulu gisa aurkezten badira ere.

DeepSeek ez da kode irekia

Produktu berriago batzuk -adibidez, DeepSeek- saiatzen dira lehiakideei aurrea hartzen, kode konpilatua eskuratzeko aukera emanez, baina hori ez da kode irekia eta ez dio aurrerapenik ekartzen ikerketa zientifikoari.

Hau da, DeepSeek “open source” modura aurkezten den arren, ez du uzten sartzen iturburu kodera, soil-soilik bitarrera (konpilatua). Ezin da irakurri, ulertu, ezta aldatu ere. Horregatik, inork ezin du hobetu programa hori. Soilik erabil daiteke enpresaren bezero gisa, ez konputazio zientzietako ikertzaile gisa.

Hori horrela, eredu informatiko horien erreproduzigarritasun eta gardentasunik ezak oztopatu egiten du aurrerapen zientifikoa eta higatu, AAn eginiko ikerketarekiko konfiantza.

Rosetta eta AlphaFold 3-ren adibidea

David Baker, Demis Hassabis eta John M. Jumper ikertzaileek 2024ko Kimikako Nobel Saria irabazi zuten, proteinen egitura iragartzeagatik. Rosetta softwarea sortu zen XX. mendearen amaieran, proiektu txiki gisa, David Bakerren laborategian, Washington estatuko unibertsitate publiko nagusian. Iturburu kodea idatzita eta banatuta zegoen Fortran goi-mailako lengoaian -edozein espezialistak irakur, uler eta alda dezakeena-, eta oinarritzen zen proteina txikien egituraren ‘ab initio' iragarpenean.

Ideia horietatik abiatuta eta ikertzaileen komunitateak sortutako proteinei buruzko datu baseak erabiliz, Google DeepMind enpresak datuen analisi estatistiko indartsu bat garatu zuen, bere AlphaFold eta AlphaFold 2 AA kodearen bidez.

2024ko maiatzean, DeepMindek AlphaFold 3 eredua aurkeztu zuen ‘Nature’ aldizkarian argitaratutako artikulu batean. Harrigarria bada ere, aldizkariak aukera eman zion enpresari eskuraezin mantentzeko softwarearen kodea, haren argitalpen politikak besterik badio ere: “irakurleen esku jartzea berehala materialak, datuak, kodea eta protokoloak, bidegabeko kalifikaziorik gabe”.

AlphaFold ere ez da kode irekia

Arloan espezialista den komunitate zientifikoko mila kidek baino gehiagok sinatu zuten ‘Nature’-ri bidalitako gutun bat, zeinaren arabera “artikulu horrek ez ditu betetzen erabilgarri, eskalagarri eta garden izateko komunitate zientifikoaren arauak”.

Sei hilabete geroago, DeepMindek eskuragarri jarri zuen kodea, Creative Commons lizentzia murriztaile baten pean. Hala ere, haren baldintzek ez dute betetzen OSIren “open source” definizioa. DeepMindek ez ditu argitaratzen ereduaren pisuak (haren sare neuronalaren entrenamenduaren emaitza). Horiek lortzeko, eskatu egin behar zaizkio, eta enpresak erabakitzen du kasu bakoitzean eman ala ez. Pisu horiek gabe, ezin da erabili AlphaFold 3, proteinen egitura aurreikusteko.

Gainera, esplizituki debekatzen du AlphaFold 3 ereduaren parametroak edo emaitzak erabiltzea jarduera komertzialetan, antzeko eredu biomolekularren entrenamendua barne.

Jarrera horren bidez, saiatzen da erantzuten, neurri batean behintzat, premia zientifikoei eta enpresaren interes komertzialei, baina argi izan behar dugu ez dela zientzia irekiko prozesu bat. Gizadi osoarena den ezagutza zientifikoan aurrera egiteko oztopo bat da.

Bilaketa barra

pil-pilean

Eguneko irudia

Adimen artifiziala, denontzat irekia ala gutxi batzuen onurarako itxia?

Artikulu hau jatorriz The Conversation argitalpenean aurki daiteke.

Zientzia irekiaren printzipioak

Zer gertatzen da AArekin?

Enpresa teknologikoen kasua

DeepSeek ez da kode irekia

Rosetta eta AlphaFold 3-ren adibidea

AlphaFold ere ez da kode irekia

Bilaketa barra

pil-pilean

Eguneko irudia

Adimen artifiziala, denontzat irekia ala gutxi batzuen onurarako itxia?

Artikulu hau jatorriz The Conversation argitalpenean aurki daiteke.

Zientzia irekiaren printzipioak

Zer gertatzen da AArekin?

Enpresa teknologikoen kasua

DeepSeek ez da kode irekia

Rosetta eta AlphaFold 3-ren adibidea

AlphaFold ere ez da kode irekia

Partekatzea