Materia

Contenido de XSL

Aprendizaje Automático (II)

Datos generales de la materia

Modalidad: Presencial
Idioma: Inglés

Descripción y contextualización de la asignatura

El curso pone el foco en un conjunto de t¿icas inspiradas en la inteligencia artificial y la estad¿ica. En la ¿ltima d¿da, estos campos han experimentado un crecimiento notable, particularmente relacionado con el an¿sis de grandes cantidades de datos mediante t¿icas y algoritmos de base matem¿ca, estad¿ica y de optimizaci¿eur¿ica. La aplicaci¿e t¿icas de aprendizaje autom¿co est¿mpliamente expandido en ¿as como la bioinform¿ca, finanzas, y tambi¿el procesamiento de textos.

El alumnado estudiar¿as principales t¿icas para la miner¿de datos, y aumentar¿us habilidades en usos de populares herramientas de software que implementan estas t¿icas. Todo ello mediante la demostraci¿obre aplicaciones reales de procesamiento de texto.

Profesorado

Nombre	Institución	Categoría	Doctor/a	Perfil docente	Área	Email
INZA CANO, IÑAKI	Universidad del País Vasco/Euskal Herriko Unibertsitatea	Profesorado Pleno	Doctor	Bilingüe	Ciencia de la Computación e Inteligencia Artificial	inaki.inza@ehu.eus

Competencias

Denominación	Peso
Habilidad para manejar las estrategias y herramientas basadas en conocimiento para el procesamiento del lenguaje humano.	30.0 %
Habilidad para el manejo y la adaptación de los métodos simbólicos y basados en corpus (aprendizaje automático) más relevantes para la investigación en las tecnologías de la lengua.	70.0 %

Tipos de docencia

Tipo	Horas presenciales	Horas no presenciales	Horas totales
Magistral	10	15	25
P. Ordenador	20	30	50

Resultados del aprendizaje de la asignatura

* Conocimiento de los principales escenarios de aprendizaje autom¿co.

* Identificar el tipo de t¿ica a aplicar en cada escenario de clasificaci¿* Conocer los pasos b¿cos, standard, de un pipeline-flujo de an¿sis de datos,

* Uso de librer¿ de R-project para la creaci¿e un corpus y su "document-term matrix" asociada, y la posterior aplicaci¿e t¿icas de aprendizaje autom¿co sobre ella.

Temario

1. Principales escenarios de clasificaci¿Formalismos y aplicaciones en cada escenario: clasificaci¿upervisada, clustering, "weakly supervised classification" ('positive unlabeled learning', 'learning from label proportions', 'partial labels', etc.)

2. T¿icas y filtros generales para el preprocesamiento de datos. Software: WEKA

3. Principales t¿icas para la selecci¿e variables. Software: WEKA

4. Validaci¿e modelos de clasificaci¿Uso de tests estad¿icos para la comparativa entre clasificadores. Software: WEKA, R, recursos web

5. El paquete 'tm'(text-mining) del software R. Construcci¿ediante operadores de 'text-mining' una 'document-term' matrix para su posterior an¿sis mediante t¿icas de aprendizaje autom¿co. Notebook-tutorial

6. 'The machine learning approach': clustering de t¿inos y clasificaci¿e documentos. Uso del paquete "caret" de R. Notebook-tutorial

7. Primeros pasos en "deep learning" para la clasificaci¿e documentos. Uso del paquete 'h2o' de R. Notebook-tutorial

Bibliografía

Bibliografía básica

*M. Kuhn, K. Johnson (2013). Applied Predictive Modeling. Springer.

*ParallelDots, online text analysis APIs for several tasks: sentiment analysis, tags' prediction, keyword generator, entity extraction, comparing similarity of texts, different emotions analysis, intent analysis, abusive text prediction, etc. https://www.paralleldots.com/text-analysis-apis

* sentiment140: an interesting project for automatic sentiment categorization of tweets: http://help.sentiment140.com/

* Stanford TreeBank project. "Recursive deep models for semantic compositionality over a semantic treebank". https://nlp.stanford.edu/sentiment/

* RDataMining website: Text mining with R: Twitter data analysis: http://www.rdatamining.com/docs/text-mining-with-r

* Awesome sentiment analysis: A curated list of Sentiment Analysis methods, implementations and misc. https://github.com/xiamx/awesome-sentiment-analysis

* "5 things you need to know about sentiment analysis and classification": https://www.kdnuggets.com/2018/03/5-things-sentiment-analysis-classification.html

* Bing Liu's website on "Opinion mining, sentiment analysis and opinion spam detection: the machine learning approach". https://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html

* 18 NLP key terms, explained for ML practitioners and NLP novices: https://www.kdnuggets.com/2017/02/natural-language-processing-key-terms-explained.html

Contenido de XSL

Sugerencias y solicitudes

Barra de búsqueda

Máster en Análisis y Procesamiento del Lenguaje

Materia

Contenido de XSL

Aprendizaje Automático (II)

Datos generales de la materia

Descripción y contextualización de la asignatura

Profesorado

Competencias

Tipos de docencia

Resultados del aprendizaje de la asignatura

Temario

Bibliografía

Bibliografía básica

Contenido de XSL

Barra de búsqueda

Ruta de navegación

Materia

Contenido de XSL

Aprendizaje Automático (II)

Datos generales de la materia

Descripción y contextualización de la asignatura

Profesorado

Competencias

Tipos de docencia

Resultados del aprendizaje de la asignatura

Temario

Bibliografía

Bibliografía básica

Contenido de XSL