Ruta de navegación

DIFusio@

25-04-2024 ;11: 00 Defensa de Tesis Doctoral Pendar Alirezazadeh

Pendar Alirezazadeh : “Angular margin-based softmax losses: toward discriminative deep metric learnig”

Zuzendariak_Directores:  Abdelmalik Moujahid Moujahid/ Fadi Dornaika

2024_04_25; 11: 00  Sala Ada Lovelace aretoa.

Abstract:

"El aprendizaje métrico profundo discriminativo persigue la construcción de un espacio de incrustación con la capacidad de agrupar instancias de la misma clase y disociarlas de aquellas pertenecientes a clases distintas mediante representaciones profundas. En este contexto, el aprendizaje métrico profundo angular se configura como un subconjunto especializado del aprendizaje métrico profundo discriminativo, destacándose por su atención a los ángulos entre los vectores de características en lugar de sus magnitudes.

Métodos clásicos como ArcFace y CosFace son reconocidos como precursores en el ámbito del aprendizaje métrico profundo angular al introducir márgenes angulares en la función de pérdida softmax. Esta estrategia busca propiciar una agrupación más cohesiva dentro de las clases, a la par que favorece una mayor separación angular entre las distintas clases. Estas metodologías han sido aplicadas de manera específica en el contexto del reconocimiento facial.

Esta tesis aporta diversas contribuciones mediante la introducción de nuevas funciones de pérdida softmax fundamentadas en márgenes angulares. La primera contribución consiste en ampliar la aplicabilidad de estas funciones de pérdida más allá del ámbito del reconocimiento facial. Se explora la eficacia de estas funciones en contextos desafiantes con datos etiquetados limitados, abordando problemáticas como la recuperación de imágenes de moda, el reconocimiento de estilos de moda y la clasificación histopatológica de imágenes de cáncer de mama.

En el contexto de la recuperación de imágenes de moda, se propone la función de pérdida de margen discriminativa (DML) con el propósito de investigar el ajuste de las penalizaciones de margen para las clases positivas y negativas. El objetivo subyacente es mejorar la capacidad discriminatoria de las incrustaciones aprendidas específicamente para la recuperación de imágenes de moda.

Para los desafíos asociados al reconocimiento de estilos de moda y rostros, se introduce la función de pérdida de margen de coseno aditivo (ACML). ACML simplifica el proceso de ajuste fino de la penalización del margen, reforzando de manera simultánea la separación entre clases y la cohesión intraclase. Este enfoque conlleva mejoras en el rendimiento para estas tareas específicas de reconocimiento.

En el ámbito del diagnóstico de cáncer de mama a partir de imágenes histopatológicas, se propone el método BAM (Boosted Additive Angular Margin Loss). BAM penaliza no solo el ángulo entre la característica profunda y su peso correspondiente de la categoría deseada, sino también los ángulos entre las características profundas y sus pesos correspondientes de categorías no deseadas. Este enfoque pretende facilitar la adquisición de características altamente discriminativas para un diagnóstico preciso, al tiempo que mejora la cohesión intraclase y amplía la discrepancia interclase, capitalizando así las ventajas derivadas de las restricciones de margen.

En términos generales, estas nuevas funciones de pérdida, que comprenden DML, ACML y BAM, aportan significativamente al ámbito de las funciones de pérdida softmax basadas en márgenes angulares al expandir su aplicación a diversos dominios y abordar desafíos específicos en cada uno de ellos.

Las funciones de pérdida propuestas fueron sometidas a un riguroso proceso de prueba y validación en diversos estudios que abordan la limitación de datos, demostrando la robustez de los resultados a través de diversas métricas, visualización de características y análisis estadístico. Es pertinente destacar que estas pérdidas mejoraron el rendimiento de numerosas arquitecturas de aprendizaje profundo. La superioridad de dichas funciones de pérdida sobre varias arquitecturas complejas basadas en el aprendizaje de características, que incorporan parámetros significativos, se confirmó mediante experimentos exhaustivos y comparaciones con pérdidas basadas en márgenes angulares en varios conjuntos de datos de referencia. Además, se evaluó el rendimiento de los modelos frente a otros métodos en conjuntos de datos extensos para ofrecer una evaluación integral de sus capacidades.

Palabras clave:

Aprendizaje Métrico Profundo Discriminativo, Función de Pérdida, Pérdida Softmax basada en Margen Angular, Recuperación de Moda en Dominio Cruzado, Reconocimiento Profundo de Estilo de Moda, Reconocimiento Profundo de Rostros, Clasificación de Cáncer de Mama."


Filtro por temas