XSLaren edukia

Ikaskuntza Automatiko Aurreratua28271

Ikastegia
Informatika Fakultatea
Titulazioa
Adimen Artifiziala Gradua
Ikasturtea
2024/25
Maila
3
Kreditu kopurua
6
Hizkuntzak
Gaztelania
Euskara
Kodea
28271

IrakaskuntzaToggle Navigation

Orduen banaketa irakaskuntza motaren arabera
Irakaskuntza motaIkasgelako eskola-orduakIkaslearen ikasgelaz kanpoko jardueren orduak
Magistrala4060
Laborategiko p.2030

Irakaskuntza-gidaToggle Navigation

Irakasgaiaren Azalpena eta Testuingurua zehazteaToggle Navigation

Ikaskuntza Automatiko Aurreratua (IAA), Adimen Artifizialeko graduan hirugarren mailako bigarren lauhilekoan irakasten den nahitaezko irakasgaia da. Datu-meatzaritzako irakasgaiaren jarraipen naturala da eta kontuan hartzen dira, halaber, Ikaskuntza Automatikoko eta Sare Neuronaletako eta Hizkuntza Naturalaren Prozesamenduko lehen lauhilekoko irakasgaietan eskuratutako ezagutzak.



Irakasgaiak eskatzen dituen ezagutzei dagokienez, Datu-meatzaritzan ikasitakoez gain, irakasgaietan oinarrizko izaerarekin ikasitakoak ere kontuan hartu beharko dira, batez ere Metodo Estatistiko Aurreratuak eta Ikerketa Operatiboa irakasgaietan ikasitakoak; izan ere, bai ikaskuntza automatikoaren oinarriek, bai ikasitako eredu askoren sorkuntzak edo ikaskuntzak probabilitatearen teoriaren nolabaiteko erabilera eta funtzio konexuen optimizazioa eskatzen dutelako.



Irakasgai honek bi atal nagusi ditu. Lehenik, gainbegiratutako sailkapen ez-estandarreko ("weak supervision", "semi-supervised classification", "multi-label", "data stream learning", "imbalance classification") arazoen konponbidea planteatu eta jorratu nahi da, kasu eta etiketa arteko ohiko harremana galtzen baita: hau da, "sailkapen gainbegiratu - supervised classification" eta "clustering" haratago dauden datu analisiko arazoak. Sailkapen ez-estandarreko eredu nagusiak azaldu: hauek ebazteko algoritmo nagusien prozedura ulertu, aplikazio praktikoak agertu, software bereziarekin praktikatu laborategietan.

Datu jarioa etengabea deneko "data stream learning"-en oinarriak azalduko dira, sailkapen gainbegiratu eta eta "clustering" arazoetarako.

Atal honek ere jorratuko ditu Fakultateko beste datu analisiko irakasgaietan ikusi ez diren hainbat kontzeptu: (i) "Interpretable Machine Learning"-en oinarriak azalduko dira, modelo baten "interpretagarritasuna" neurtzeko metrika nagusiak agertuz. (ii) Test estatistikoak erabili modeloen konparaketarako. (iii) PCA-az haratago: Datu bistaraketa aurreratua t-SNE-rekin.



Bigarren atalean, ikasleei ikaskuntza automatikoari buruzko oinarri teorikoak irakasten zaizkie. "Statistical Machine Learning" izenpean ezagutzen den teoriaren oinarriak non, hauek azaltzen diguten datuetatik ikasitako modelo baten ezaugarri teorikoak, bermeak, bere arrakasta edo porrotaren zergatia.





Gaitasunak / Irakasgaia Ikastearen EmaitzakToggle Navigation

Ikaskuntzaren emaitzak:

- "Sailkapen gainbegiratu - supervised classification" eta "clustering" haratago dauden datu analisiko arazoen oinarri algoritmiko-praktikoak ezagutzea.

- "Statistical Machine Learning" teoriaren oinarriak barneratu.

Eduki teoriko-praktikoakToggle Navigation

1. Introduction to Data Science - datu analisiko problemen taxonomia



2. Modu ahulean gainbegiratutako sailkapena - weak supervision scenarios:

- One-class classification and outlier detection

- Sailkapen erdi-gainbegiratua - semi-supervised classification





3. Sailkapen gainbegiratu ez-estandarra

- MultiLabel classification

- Datu jario etengabeen modelizazioa: data stream learning

- Sailkapen gainbegiratu desorekatua - Imbalance supervised classification



4. "Interpretable machine learning"-erako metrika nagusiak

5. Datu bistaraketa aurreratua t-SNE-rekin

6. Test estatistikoen erabilpena sailkapen modeloen konparaketarako





7. Ikaskuntza automatikoaren oinarriak - Statistical Machine Learning

- Ikasketarako oinarriak - sailkapen problemaren formalizazioa

- Galera-funtzioak - principal loss functions

- Arrisku enpirikoa minimizatzea - empirical risk minimization

- Sailkapen eredu linealak eta kerneletan oinarritutakoak (Support Vector Machines)

MetodologiaToggle Navigation

Irakasgai honetan hainbat irakaskuntza-metodologia erabiliko dira. Gaiaren kontzeptuak azaltzeko klaseak emango dira eta ikasleek bertan parte hartzeko aukera izango dute.



Eskola horietan irakasleak gaian zehar garatu nahi dituen kontzeptu nagusiak azalduko ditu eta azaldutako kontzeptuekin ebatzi daitezkeen hainbat problema aurkeztuko ditu. Ikasleek bai banaka zein taldeka, problema horiek ebazteko behar diren oinarriak aztertu beharko ditu. Ikasleek biko taldetan lan egin dezakete, baina gero, dokumentazioaren garapena eta praktikaren entrega guztiak, indibidualak izango dira. Irakasleak hauen inguruko elkarrizketa pertsonalak egingo ditu.



Laborategiko praktiketan, arazoetan oinarritutako ikaskuntza indartzen jarraituko da. Hainbat problema aurkeztuko dira, eta ikasleak algoritmo desberdinak erabiliz ebatzi beharko dituzte. Arazoari irtenbidea aurkitzeko, eskuragarri dagoen kode eta software paketeak erabiliko du edota algoritmo berriak garatu beharko ditu.



Ikasleen ikaskuntza errazteko eta bermatzeko, gelako eta laborategiko praktiken jarraipena etengabekoa izango da, aldez aurretik ezarritako ebaluazio-irizpideetan oinarrituta emango da feed-back-a, ikasleek beren ikaskuntzaz eta hura hobetzeko moduez jabetzeko aukera izan dezaten.

Ebaluazio-sistemakToggle Navigation

  • Ebaluazio Jarraituaren Sistema
  • Azken Ebaluazioaren Sistema
  • Kalifikazioko tresnak eta ehunekoak:
    • Garatu beharreko proba idatzia (%): 40
    • Praktikak egitea (ariketak, kasuak edo buruketak) (%): 60

Ohiko Deialdia: Orientazioak eta Uko EgiteaToggle Navigation

Irakasgaia bi modutan gainditu ahal izango da: ebaluazio jarraituaren bidez edo amaierako ebaluazioaren bidez. Ebaluazio jarraituaren sistema da lehenetsitakoa, UPV/EHUko araudian adierazten

den moduan, eta irmo gomendatzen dizueguna hori da: hitzegin irakaslearekin jarritako epeak ebaluazio jarraituan betetzeko gai ez bazarete. Zintzo eta gogor gomendatzen dugu ebaluazio jarraitua.



Alternatibarik ez balego eta ikasle batek amaierako ebaluazioa aukeratu beharko balu, irakasgaiko irakasle arduradunei adierazi behar die nahi hori modu honetan eta epe hauetan: idazki bat sinatuz ikasturtea hasi eta bederatzi aste igaro aurretik.



Irakasgaiaren ebaluazioa etengabekoa izango da defektuz, eta atal hauek izango ditu:



1. "Laborategi eta Praktikak". Lauhilekoan zehar egin beharreko zereginak eta frogak: Irakasgaiaren notaren % 60. Banakako lan pertsonalak. Gelan eta laborategietako praktiketan aurkeztu diren problemen ebazpena ebaluatzeko erabiliko direnak. Irakasleak ikasleekin elkarrizketak egingo ditu entregatutako lanaren inguruan. Hauek entregatzeko, kurtsoan zehar epeak jarriko dira.



2. "Eduki teorikoak" (notaren %40a). Bi azterketa egingo dira eduki hauen inguruan. Lehenengoa (notaren %20a), "aste trinkoko" eguna erabiliz. Bigarren azterketa (notaren %20a), Informatika Fakultateko dekanotzak jarritako datan izango da, "ohiko konbokatoriarako, lehen deialdia" (maiatza bukaera). Proba idatzi hauetan kontzeptu teorikoen ezagutza lortu dutela erakutsi beharko dute ikasleek. Proba idatzia irakaslearekin ez adostu ezkeroz, deialdiari uko egin diotela ulertuko da eta bere kalifikazioa “ez aurkeztua” izango da.



Azken kalifikazioa lortzeko kalifikazio horien batuketa egingo da, baina ezinbestekoa izango da gutxienez lau bat hamarretik ateratzea proba bakoitzean (hau da, lauhilekoan egindako frogak eta azterketa garaiko froga idatzian).



Ikasleek eskubidea izango dute azken ebaluazio bidez ebaluatuak izateko. Eskubide hori baliatzeko, ikasleak etengabeko ebaluazioari uko egiten diola jasotzen duen idatzi bat aurkeztu beharko dio irakasgaiaren ardura duen irakasleari eta, horretarako, bederatzi asteko epea izango du, ikastegiaren akademi-egutegia oinarri hartuta. "Laborategi eta praktikak" (notaren %60a), azterketa eguna baino 10 egun lehenago entregatu beharko ditu eGelan. Azterketa eguna, Informatika Fakultateko Dekanotzak zehaztutako datan izango da, "ohiko konbokatoriarako".











Ezohiko deialdia: Orientazioak eta Uko EgiteaToggle Navigation

Ezohiko deialdian ohiko deialdian ikasleekin erabiliko diren ebaluazio irizpide berberak erabiliko dira.



Ohiko deialdian etengabeko ebaluazioa aukeratu duten ikasleek, ezohiko deialdirako lauhilekoan zehar egin beharreko laborategi-praktiken nota gorde dezakete (notaren %60).



Ikasle talde txikia izanik ez-ohiko azterketa teoriko hau egin beharko duen ikasleak, ez-ohiko idatzizko froga hau egiteko (notaren %40a): ikasleak, indibidualki, irakaslearekin adostuko du zein egun eta ordutan egin, ikaslea bera prest egiteko dagoela ulertzen duenean. Askatasun hau ematen zaio ikasleari. Ikaslea, indibidualki, zuzenduko da irakasleari, adieraziz ez-ohiko azterketa hau egin nahi duela, eta azterketa egiteko data bat adostuko dute. Adostutako data azterketa hau egiteko, ekaineko edozein egunetan: beti, uztailaren 5a baino lehen.



Proba idatzi hauetan kontzeptu teorikoen ezagutza lortu dutela erakutsi beharko dute ikasleek. Proba idatzia irakaslearekin ez adostu ezkeroz, deialdiari uko egin diotela ulertuko da eta bere kalifikazioa “ez aurkeztua” izango da.



Ez-ohiko deialdi honetan ebaluatua izateko, falta diren lan praktikoak entregatzeko epea, ekainaren 10a izango da.



Azken kalifikazioa lortzeko kalifikazio horien batuketa egingo da, baina ezinbestekoa izango da gutxienez lau bat hamarretik ateratzea proba bakoitzean (hau da, lauhilekoan egindako frogak eta azterketa garaiko froga idatzian).



Ezohiko deialdiari uko egiteko nahikoa izango da eduki teorikoen azterketa ez egitea.



Nahitaez erabili beharreko materialaToggle Navigation

----

BibliografiaToggle Navigation

Oinarrizko bibliografia

- J. Hernández-González, I. Inza, J.A. Lozano (2016). Weak supervision and other non-standard classification problems: a taxonomy. Pattern Recognition Letters, 69, 49-55. https://doi.org/10.1016/j.patrec.2015.10.008



- R. Domingues, M. Filippone, P. Michiardi, J. Zouaoui (2018). A comparative evaluation of outlier detection algorithms: Experiments and analysis. Pattern Recognition 74, 406-421.



- J.E. Van Engelen, H.H. Hoos (2020). A survey on semi-supervised learning. Machine Learning, 109(2), 373-440. https://link.springer.com/article/10.1007/s10994-019-05855-6



- A. Bifet, R. Gavaldà, G. Holmes, B. Pfahringer (2018). Machine Learning for Data Streams with Practical Examples in MOA. MIT Press. https://moa.cms.waikato.ac.nz/book/



- F. Herrera, F. Charte, A.J. Rivera, M.J. del Jesús (2016). Multilabel Classification. Springer. https://link.springer.com/chapter/10.1007/978-3-319-41111-8_2



- L.J.P. van der Maaten, G.E. Hinton (2008). Visualizing data using t-SNE. Journal of Machine Learning Research. 9: 2579–2605. https://www.jmlr.org/papers/volume9/vandermaaten08a/vandermaaten08a.pdf



- T. Hastie, R. Tibshirani, J.H. Friedman (2009). The elements of statistical learning: data mining, inference, and prediction (Vol. 2, pp. 1-758). Springer. https://link.springer.com/book/10.1007/978-0-387-84858-7



- U. von Luxburg, B. Schölkopf (2008). Statistical learning theory: models, concepts and results. arXiv:0810.4752. https://arxiv.org/abs/0810.4752

Gehiago sakontzeko bibliografia

XXX

Web helbideak

- A. Bifet, R. Gavaldà, G. Holmes, B. Pfahringer (2018). Machine Learning for Data Streams with Practical Examples in MOA. MIT Press. https://moa.cms.waikato.ac.nz/book/

- River: online machine learning in Python (2024). https://riverml.xyz/latest/

- t-Distributed Stochastic Neighbor Embedding (t-SNE) (2024). Theory, software, examples, FAQ. https://lvdmaaten.github.io/tsne/

- U. von Luxburg (2020). Statistical Machine Learning. YouTube videos serie. https://www.youtube.com/playlist?list=PL05umP7R6ij2XCvrRzLokX6EoHWaGA2cC

TaldeakToggle Navigation

16 Teoriakoa (Gaztelania - Arratsaldez)Erakutsi/izkutatu azpiorriak

Egutegia
AsteakAstelehenaAstearteaAsteazkenaOstegunaOstirala
16-30

14:00-15:30 (1)

17:00-18:30 (2)

Irakasleak

16 Laborategiko p.-1 (Gaztelania - Arratsaldez)Erakutsi/izkutatu azpiorriak

Egutegia
AsteakAstelehenaAstearteaAsteazkenaOstegunaOstirala
16-30

15:30-17:00 (1)

Irakasleak

31 Teoriakoa (Euskara - Goizez)Erakutsi/izkutatu azpiorriak

Egutegia
AsteakAstelehenaAstearteaAsteazkenaOstegunaOstirala
16-30

09:00-10:30 (1)

12:00-13:30 (2)

Irakasleak

31 Laborategiko p.-1 (Euskara - Goizez)Erakutsi/izkutatu azpiorriak

Egutegia
AsteakAstelehenaAstearteaAsteazkenaOstegunaOstirala
16-30

10:30-12:00 (1)

Irakasleak