Aprendizaje profundo en imágenes de alimentos con etiquetas múltiples y ruidosas
Palabras clave:
Aprendizaje con etiquetas ruidosas, Aprendizaje multi-etiqueta, Reconocimiento de ingredientes, Aprendizaje profundo, Análisis de comidaResumen
El rendimiento de los métodos de aprendizaje profundo no solo depende del diseño del modelo, sino también de la cantidad, variedad y calidad de los datos. La recopilación de abundantes datos de repositorios públicos es factible, pero la revisión y anotación resulta laboriosa. Como alternativa, se han desarrollado bases de datos no supervisadas, donde la asignación automática de etiquetas puede generar ruido debido a posibles desviaciones en los datos recopilados. En este trabajo proponemos un modelo de aprendizaje profundo robusto a etiquetas ruidosas para la tarea de clasificación de imágenes de alimentos a nivel de ingredientes, mediante la extensión del método de etiqueta única AFM. La propuesta, ML-AFM, utiliza Attentive Grouping y MixUp para mitigar el ruido de las etiquetas y capturar relaciones complejas entre características y etiquetas en los datos de entrenamiento. Adicionalmente, se adapta la función de activación y pérdida para que sea apropiada a problemas de clasificación multi-etiqueta. La evaluación experimental se realiza sobre el conjunto de datos público Food-101N, con anotaciones ampliadas a nivel de ingredientes. De los resultados se observa que ML-AFM proporciona un mejor rendimiento que el modelo de la línea base, alcanzando un F1 de 86,99%, un AUPRC de 92,85% y un índice de Jaccard de 77,19%. La mejora del rendimiento demuestra la robustez del modelo propuesto frente al problema planteado, lo que respalda su utilidad en aplicaciones prácticas de reconocimiento de alimentos.
Descargas
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2024 Revista Ingeniare

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.