Gaia
Hizketa Teknologiak
Gaiari buruzko datu orokorrak
- Modalitatea
- Ikasgelakoa
- Hizkuntza
- Ingelesa
Irakasgaiaren azalpena eta testuingurua
Irakasgaiaren helburua ikasleak ahots-seinalearen prozesamenduaren oinarrizko aplikazioekin ohitzea da, hala nola sintesiarekin eta hizketaren ezagutza automatikoarekin. Ikuspegi praktiko batetik, bi teknologietan eman diren paradigma nagusiak aztertuko dira, sistema horiek sortzeko prozedurak deskribatuko dira, eta baita beharrezkoak diren baliabideak eta ahots datu baseak sortzeko. Ikasleek sistema errealekin praktikatuko dute. Horrez gain, ahotsaren prozesamenduarekin lotutako beste aplikazio batzuk ere berrikusiko dira labur-labur, hala nola esatariaren edo emozioaren ezagutza, ahotsaren bihurketa edo diarizazioa, besteak beste.Ikasgai hau ikasteko, ikasleak mintzamena ekoizteko oinarrizko ereduak, seinalearen denborazko eta maiztasunezko analisiaren kontzeptuak eta seinaleak digitalizatzeko oinarriak ezagutu behar ditu.
Irakasleak
Izena | Erakundea | Kategoria | Doktorea | Irakaskuntza-profila | Arloa | Helbide elektronikoa |
---|---|---|---|---|---|---|
NAVAS CORDON, EVA | Euskal Herriko Unibertsitatea | Irakaslego Agregatua | Doktorea | Elebakarra | Seinalearen Teoria eta Komunikazioak | eva.navas@ehu.eus |
SARATXAGA COUCEIRO, IBON | Euskal Herriko Unibertsitatea | Irakaslego Agregatua | Doktorea | Elebiduna | Ingeniaritza Telematikoa | ibon.saratxaga@ehu.eus |
Gaitasunak
Izena | Pisua |
---|---|
Comprender e interpretar los principales parámetros utilizados en la representación de la señal de voz. | 25.0 % |
Conocer las estrategias fundamentales empleadas en los sistemas de síntesis y de reconocimiento de la señal de voz. | 25.0 % |
Comprender la terminología empleada en el campo del tratamiento de la señal de voz, de forma que sea capaz de interpretar un trabajo de investigación descrito en una revista. | 25.0 % |
Manejar las herramientas informáticas básicas para el procesado y tratamiento de la señal de voz. | 25.0 % |
Irakaskuntza motak
Mota | Ikasgelako orduak | Ikasgelaz kanpoko orduak | Orduak guztira |
---|---|---|---|
Magistrala | 15 | 22.5 | 37.5 |
Ordenagailuko p. | 30 | 45 | 75 |
Ebaluazio-sistemak
Izena | Gutxieneko ponderazioa | Gehieneko ponderazioa |
---|---|---|
Azalpenak | 20.0 % | 40.0 % |
Praktiken Memoria/Txostenak | 20.0 % | 50.0 % |
Test motako azterketa | 30.0 % | 60.0 % |
Irakasgaia ikastean lortuko diren emaitzak
RA1 Ahots-seinalearen modelatze akustikoarekin lotutako arazoak ulertzea.RA2 Ahots-seinalea aztertzeko eta prozesatzeko tresnak erabiltzea.
RA3 Ahots sintesi sistemak eta mintzamena eta hiztuna automatikoki ezagutzeko sistemak ulertzea, baita horiek ebaluatzeko erabiltzen diren teknikak ere.
RA4 Hizketa ezagutzeko oinarrizko sistema garatzea.
RA5 Artikulu zientifiko batetik informazioa ateratzea eta ahoz aurkeztea diziplina arteko eta nazioarteko publikoari.
Ohiko deialdia: orientazioak eta uko egitea
Ebaluazio-sistema hiru multzo independentetan banatzen da: magistrala, laborategiko praktikak eta hizketa-teknologia bati buruzko lan baten azalpena.Alderdi magistrala banakako idatzizko proba baten bidez ebaluatzen da, galdera laburretatik eta aukera anitzeko galderetatik abiatuta (% 40).
Laborategiko praktiken zatia memorien eta laborategian egindako lanaren bidez ebaluatzen da (% 40).
Lanaren azalpena jendaurreko aurkezpen batekin ebaluatzen da (% 20).
Ohiko deialdian alderdi magistraleko proba gainditu behar da 10etik 3ko gutxieneko notarekin, eta irakasgaia gainditzeko 10etik 5etik gorako amaierako nota lortu behar da kalifikazio guztiak gehitu ondoren. Ebaluazio-bloke bakoitza independentea da, eta bloke bat gainditu ondoren, nota hurrengo ezohiko deialdirako gordeko da.
UKO EGITEA:
Ebaluazio mistoa egin ezin dutenek arrazoiak justifikatu beharko dizkiote irakasle taldeari, indarrean dagoe araudian ezarritako prozedurari jarraikiz. Irakasgaiaren ikaskuntzaren emaitzak azken ebaluazio baten bidez frogatu ahal izango dituzte: idatzizko proba bat (%40 nota), laborategiko proba bat (%45 nota) eta hizketaren teknologiarekin zerikusia duen lan bat aurkeztea (%15 nota).
Pertsona bat azken proba idatzira aurkezten ez bada, ulertuko da pertsona horrek deialdi horri uko egin diola.
Ezohiko deialdia: orientazioak eta uko egitea
Aparteko deialdian bi proba eginen dira: bloke magistraleko proba bat eta laborategiko proba bat. Proba bakoitzak azken notaren% 50 izanen du eta bloke magistraleko proba gainditu behar da 10etik 3ko gutxieneko notarekin.Irakasgai-zerrenda
1. Ahots-modelatzea2. Hizketa sintesia
3. Hizketa ezagupena
4. Beste hizketa teknologiak
Bibliografia
Nahitaez erabili beharreko materiala
Irakasgaiaren apunteak: magistralak eta praktikak.Oinarrizko bibliografia
- J. G. Proakis, D. G. Manolakis. Digital signal processing. Principles, algorithms and applications (4th edition). Pearson Prentice Hall, 2007. (ISBN: 978-0131873742)- L. R. Rabiner, R. W. Schafer. Digital processing of speech signal. Prentice-Hall, 1978. (ISBN: 978-0132136037)
- X. Huang, A. Acero, H. Hon. Spoken Language Processing: A Guide to Theory, Algorithm and System Development. Prentice Hall, 2001. (ISBN: 978-0130226167)
- A. V. Oppenheim, R. W. Schafer. Discrete-Time signal processing (3rd edition). Pearson Prentice Hall, 2009. (ISBN: 978-0131988422)
Gehiago sakontzeko bibliografia
- P. Taylor. Text-to-Speech Synthesis. Cambridge University Press, 2009. (ISBN: 978-0521899277)- L. Rabiner, B. H. Juang. Fundamentals of Speech Recognition. CRC Press, 1993. (ISBN: 78-0130151575)
- D. Yu, L. Deng. Automatic Speech Recognition: A Deep Learning Approach. Springer, 2015. (ISBN: 978-1447157786)
- W. C. Chu. Speech Coding Algorithms: Foundation and Evolution of Standardized Coders. Wiley-Interscience, 2003. (ISBN: 978-0471373124)
Aldizkariak
Computer Speech and LanguageSpeech Communication
IEEE Transactions on Audio, Speech & Language Processing
IEEE Transactions on Systems, Man and Cybernetics-Part B
IEEE Transactions on Multimedia
Journal of the Acoustical Society of America
Estekak
- Speech Technologieshttp://www.speech.cs.cmu.edu/ news:comp.speech http://festvox.org/
- Review of Speech Synthesis Technology
http://www.acoustics.hut.fi/publications/files/theses/lemmetty_mst/contents.html
- Speech Technology Hyperlinks Page
http://www.speech.cs.cmu.edu/comp.speech/Section5/speechlinks.html
- Demos de sistemas TTS
http://www.acapela-group.com/text-to-speech-interactive-demo.html
http://www.loquendo.com/en/demo-center/tts-demo/
http://enterprisecontent.nuance.com/vocalizer5-network-demo/index.html
http://aholab.ehu.es/tts/tts_en.html