Materia
Aprendizaje Automático (II)
Datos generales de la materia
- Modalidad
- Presencial
- Idioma
- Inglés
Descripción y contextualización de la asignatura
El curso pone el foco en un conjunto de t¿icas inspiradas en la inteligencia artificial y la estad¿ica. En la ¿ltima d¿da, estos campos han experimentado un crecimiento notable, particularmente relacionado con el an¿sis de grandes cantidades de datos mediante t¿icas y algoritmos de base matem¿ca, estad¿ica y de optimizaci¿eur¿ica. La aplicaci¿e t¿icas de aprendizaje autom¿co est¿mpliamente expandido en ¿as como la bioinform¿ca, finanzas, y tambi¿el procesamiento de textos.El alumnado estudiar¿as principales t¿icas para la miner¿de datos, y aumentar¿us habilidades en usos de populares herramientas de software que implementan estas t¿icas. Todo ello mediante la demostraci¿obre aplicaciones reales de procesamiento de texto.
Profesorado
Nombre | Institución | Categoría | Doctor/a | Perfil docente | Área | |
---|---|---|---|---|---|---|
INZA CANO, IÑAKI | Universidad del País Vasco/Euskal Herriko Unibertsitatea | Profesorado Pleno | Doctor | Bilingüe | Ciencia de la Computación e Inteligencia Artificial | inaki.inza@ehu.eus |
Competencias
Denominación | Peso |
---|---|
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano. | 30.0 % |
Habilidad para el manejo y la adaptación de los métodos simbólicos y basados en corpus (aprendizaje automático) más relevantes para la investigación en las tecnologías de la lengua. | 70.0 % |
Tipos de docencia
Tipo | Horas presenciales | Horas no presenciales | Horas totales |
---|---|---|---|
Magistral | 10 | 15 | 25 |
P. Ordenador | 20 | 30 | 50 |
Resultados del aprendizaje de la asignatura
* Conocimiento de los principales escenarios de aprendizaje autom¿co.* Identificar el tipo de t¿ica a aplicar en cada escenario de clasificaci¿* Conocer los pasos b¿cos, standard, de un pipeline-flujo de an¿sis de datos,
* Uso de librer¿ de R-project para la creaci¿e un corpus y su "document-term matrix" asociada, y la posterior aplicaci¿e t¿icas de aprendizaje autom¿co sobre ella.
Temario
1. Principales escenarios de clasificaci¿Formalismos y aplicaciones en cada escenario: clasificaci¿upervisada, clustering, "weakly supervised classification" ('positive unlabeled learning', 'learning from label proportions', 'partial labels', etc.)2. T¿icas y filtros generales para el preprocesamiento de datos. Software: WEKA
3. Principales t¿icas para la selecci¿e variables. Software: WEKA
4. Validaci¿e modelos de clasificaci¿Uso de tests estad¿icos para la comparativa entre clasificadores. Software: WEKA, R, recursos web
5. El paquete 'tm'(text-mining) del software R. Construcci¿ediante operadores de 'text-mining' una 'document-term' matrix para su posterior an¿sis mediante t¿icas de aprendizaje autom¿co. Notebook-tutorial
6. 'The machine learning approach': clustering de t¿inos y clasificaci¿e documentos. Uso del paquete "caret" de R. Notebook-tutorial
7. Primeros pasos en "deep learning" para la clasificaci¿e documentos. Uso del paquete 'h2o' de R. Notebook-tutorial
Bibliografía
Bibliografía básica
*M. Kuhn, K. Johnson (2013). Applied Predictive Modeling. Springer.*ParallelDots, online text analysis APIs for several tasks: sentiment analysis, tags' prediction, keyword generator, entity extraction, comparing similarity of texts, different emotions analysis, intent analysis, abusive text prediction, etc. https://www.paralleldots.com/text-analysis-apis
* sentiment140: an interesting project for automatic sentiment categorization of tweets: http://help.sentiment140.com/
* Stanford TreeBank project. "Recursive deep models for semantic compositionality over a semantic treebank". https://nlp.stanford.edu/sentiment/
* RDataMining website: Text mining with R: Twitter data analysis: http://www.rdatamining.com/docs/text-mining-with-r
* Awesome sentiment analysis: A curated list of Sentiment Analysis methods, implementations and misc. https://github.com/xiamx/awesome-sentiment-analysis
* "5 things you need to know about sentiment analysis and classification": https://www.kdnuggets.com/2018/03/5-things-sentiment-analysis-classification.html
* Bing Liu's website on "Opinion mining, sentiment analysis and opinion spam detection: the machine learning approach". https://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html
* 18 NLP key terms, explained for ML practitioners and NLP novices: https://www.kdnuggets.com/2017/02/natural-language-processing-key-terms-explained.html