Generación de imágenes realistas de libros infantiles basadas en modelos de difusión
Palabras clave:
Imagen realista, Libros infantiles, Modelos de difusión, ControlNet, BordesResumen
En este artículo se presenta un modelo para la generación de imágenes realistas para libros infantiles usando modelos de difusión. Se explica cada etapa del modelo propuesto, pero el enfoque principal es revisar el área de investigación existente sobre modelos de difusión controlados. Particularmente, se utiliza ControlNet, un modelo de red neuronal que permite agregar controles para guiar la generación de imágenes. Se emplearon bordes (Canny, Sobel y Prewitt) como controles. Además, se diseñó un banco de imágenes extraídas de libros infantiles para generar nuevas versiones de libros con imágenes realistas. Las pruebas se realizaron con los libros "El Principito" y "La Gaviota y el Pingüino". Los resultados destacan que ControlNet es una herramienta poderosa para generar imágenes visualmente atractivas y diversas, afirmando su relevancia para ilustradores y desarrolladores de libros infantiles. Se concluye que el uso de bordes como control mejora significativamente el nivel de detalle en las imágenes generadas.
Descargas
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2024 Nayeli Joaquinita Meléndez Acosta, Edmundo Bonilla Huerta, José Federico Ramírez Cruz, Yesenia Nohemí González Meneses

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Los autores/as conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra, el cuál estará simultáneamente sujeto a la Licencia de Reconocimiento de Creative Commons CC-BY que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación esta revista.


