Minería de Datos Textuales28275
- Centro
- Facultad de Informática
- Titulación
- Grado en Inteligencia Artificial
- Curso académico
- 2023/24
- Curso
- 3
- Nº Créditos
- 6
- Idiomas
- Castellano
- Euskera
- Código
- 28275
DocenciaAlternar navegación
Guía docenteAlternar navegación
Descripción y Contextualización de la AsignaturaAlternar navegación
Uno de los campos principales de la inteligencia artificial es la comprensión del lenguaje, que ha dado lugar a aplicaciones que han llegado a nuestros móviles, tales como asistentes virtuales (incluyendo Siri, Alexa) y traductores automáticos, o aplicaciones que analizan grandes masas de texto, tales como detectores de sentimiento o sistemas que extraen y agregan información proveniente de redes sociales o páginas web. Al mismo tiempo, quedan importantes retos, ya que la comprensión del lenguaje implica la IA general.
Esta asignatura es posterior a la asignatura Procesamiento del Lenguaje, donde se ven las bases teorícas y los niveles de procesamiento.
En esta asignatura se profundiza en la extracción de significado a partir de texto en lenguaje humano, ya sea de páginas web, redes sociales o cualquier otro tipo de documento. Revisaremos las aplicaciones principales, incluidas la búsqueda, clasificación, agrupación y extracción de documentos.
La asignatura tiene una aproximación práctica.
Competencias/ Resultados de aprendizaje de la asignaturaAlternar navegación
1. Comprender los principales conceptos sobre la minería de datos textuales y la tecnología del lenguaje, y tener una visión global del área.
2. Entender y utilizar las herramientas y recursos.
3. Entender como se estructuran las aplicaciones de minería de datos textuales.
4. Analizar una aplicación concreta e identificar las opciones y ventajas de utilizar técnicas de minería de datos textuales para afrontarlo.
5. Diseñar e implementar aplicaciones concretas que utilicen minería de datos textuales.
6. Utilizando métodos empíricos, diseñar y llevar a cabo los experimentos necesarios para conocer el rendimiento de aplicaciones concretas.
Contenidos teórico-prácticosAlternar navegación
Herramientas y recursos:
- Rastreo, obtención y limpieza de documentos desde Internet y redes sociales (crawling)
- Librerías de procesamiento de lenguaje
- Recursos semánticos
- Técnicas de clasificación y agrupación de documentos
Aplicaciones:
- Busqueda
- Extracción
- Sistemas de pregunta-respuesta
- Minería de opiniones
- Traducción automática
MetodologíaAlternar navegación
Además de las clases magistrales, se realizarán prácticas y laboratorios obligatorios en el ordenador. Estas se organizarán de tal manera que complementen a lo explicado en las clases teóricas. El objetivo de las clases prácticas es por un lado, promover el trabajo continuo, y por el otro, poder realizar una evaluación continua. El objetivo de la práctica es el poder aplicar lo aprendido a distintos problemas y el trabajar la creatividad del alumnado.
En los tipos de docencia, magistral y práctico, se usarán metodologías activas. Esto es, el alumnado participará de manera activa tanto en clase como en el laboratorio.
Sistemas de evaluaciónAlternar navegación
- Sistema de Evaluación Continua
- Sistema de Evaluación Final
- Herramientas y porcentajes de calificación:
- Realización de prácticas (ejercicios, casos o problemas) (%): 50
- Trabajos individuales (%): 50
Convocatoria Ordinaria: Orientaciones y RenunciaAlternar navegación
En la asignatura se aplicará el Protocolo sobre ética académica y prevención de las prácticas deshonestas o fraudulentas en las pruebas de evaluación y en los trabajos académicos en la UPV/EHU.
La asignatura tiene dos modos de evaluación: evaluación continua y evaluación final.
La preinscripción en el modo de evaluación continua se realizará al principio del curso. La preinscripción pasará a ser definitiva tras la confirmación de la solicitud por parte del estudiante en las fechas que se establezcan (entre el 60% y el 80% del curso) y previa verificación del rendimiento parcial por parte del profesorado. Si en las mencionadas fechas el/la alumno/a no confirma su inscripción definitiva en evaluación continua se entenderá que renuncia a la misma.
EVALUACIÓN CONTINUA
- % 50 Entregas de los laboratorios y resultados de los test de evalución
- % 50 Práctica individual
Todas las pruebas y actividades mencionadas para la evaluación continua son obligatorias.
Las condiciones para aprobar en la evaluación continua son:
- Conseguir al menos el 30% de la puntuación en cada actividad de laboratorio
- Conseguir un 40% de la nota de la práctica
- Conseguir, después de un cálculo porcentual, un 50% o más de la nota.
Si la/el alumna/o no expresa en plazo su renuncia a la evaluación continua y no cumple alguna de las condiciones para superar la evaluación continua, suspenderá la asignatura en la convocatoria ordinaria y podrá optar a la convocatoria extraordinaria. Si no presentara la práctica, se le evaluaría como no presentado.
EVALUACIÓN FINAL
- 50% Prueba escrita
- 50% Práctica individual
Para poder presentarse a la prueba escrita, habrá que haber entregado previamente la práctica individual. Todas las pruebas y actividades mencionadas son obligatorias.
Las condiciones para aprobar en la evaluación final son:
- Conseguir al menos el 40% de la puntuación en la prueba escrita
- Conseguir un 40% de la nota de la práctica
- Conseguir, después de un cálculo porcentual, un 50% o más de la nota.
Si la/el alumna/o no realiza la prueba escrita se entiende que renuncia a la evaluación. Si no presentara la práctica, se le evaluaría como no presentado.
Convocatoria Extraordinaria: Orientaciones y RenunciaAlternar navegación
EVALUACIÓN FINAL
- 50% Prueba escrita
- 50% Práctica individual
Para poder presentarse a la prueba escrita, habrá que haber entregado previamente la práctica individual. Todas las pruebas y actividades mencionadas son obligatorias.
Las condiciones para aprobar en la evaluación final son:
- Conseguir al menos el 40% de la puntuación en la prueba escrita
- Conseguir un 40% de la nota de la práctica
- Conseguir, después de un cálculo porcentual, un 50% o más de la nota.
Si la/el alumna/o no realiza la prueba escrita se entiende que renuncia a la evaluación. Si no presentara la práctica, se le evaluaría como no presentado.
Materiales de uso obligatorioAlternar navegación
El material disponible en la plataforma virtual (eGela).
BibliografíaAlternar navegación
Bibliografía básica
Jurafsky D., Martin J. H. Speech and Language Processing (3rd edition draft). An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Prentice Hall, 2018. https://web.stanford.edu/~jurafsky/slp3/
GruposAlternar navegación
01 Teórico (Castellano - Mañana)Mostrar/ocultar subpáginas
Semanas | Lunes | Martes | Miércoles | Jueves | Viernes |
---|---|---|---|---|---|
16-30 | 10:30-12:00 (1) | 12:00-13:30 (2) |
Profesorado
01 P. Laboratorio-1 (Castellano - Mañana)Mostrar/ocultar subpáginas
Semanas | Lunes | Martes | Miércoles | Jueves | Viernes |
---|---|---|---|---|---|
16-30 | 09:00-10:30 (1) |
Profesorado
46 Teórico (Euskera - Tarde)Mostrar/ocultar subpáginas
Semanas | Lunes | Martes | Miércoles | Jueves | Viernes |
---|---|---|---|---|---|
16-30 | 15:30-17:00 (1) | 17:00-18:30 (2) |
Profesorado
46 P. Laboratorio-1 (Euskera - Tarde)Mostrar/ocultar subpáginas
Semanas | Lunes | Martes | Miércoles | Jueves | Viernes |
---|---|---|---|---|---|
16-30 | 14:00-15:30 (1) |