06 – ComfyUI: Image 2 Image & InPaintig. Stable Diffusion XL

Cómo Usar Imágenes como Referencias, en ConfiUI

Introducción

Las imágenes se han convertido en un componente integral en la generación de contenido con inteligencia artificial. En este capítulo, aprenderás cómo usar imágenes como referencia latente para tus creaciones con ComfyUI. Este proceso, comúnmente conocido como “image to image” (imagen a imagen), te permitirá generar nuevas imágenes basadas en otras ya existentes. Exploraremos el uso de técnicas de etiquetado, la configuración de diferentes modelos, así como la implementación de máscaras para realizar cambios específicos en partes de la imagen.

Utilizar imágenes como referencias tiene múltiples aplicaciones y puede ser especialmente útil en la creación de retratos detallados, modificaciones específicas de características y en la personalización de imágenes generadas. A lo largo de este tutorial descubrirás cómo manejar un flujo de trabajo eficiente y organizado utilizando herramientas avanzadas, todo explicado de manera clara y sencilla.

Creación de Imágenes con “Image to Image”

Para empezar a trabajar con imágenes como referencia, necesitamos configurar el entorno de ComfyUI. Esto incluye la selección y configuración de diferentes modelos, como lo es el Realis Engine SD XL que puede descargarse fácilmente desde la plataforma de Civitai. Además, se utilizarán diferentes tipos de clip text encoders para los prompts positivos y negativos.

Una de las primeras tareas consiste en configurar un sampler y un latent image, fundamental para la creación de imágenes. A medida que generamos nuevas imágenes, se debe definir una resolución adecuada, como 1024×1024 píxeles, y finalmente, se decodifica la imagen latente en el dominio de píxeles.

Utilización de un Etiquetador (Tagger)

El etiquetado de imágenes es una técnica útil para obtener textos descriptivos que pueden ser utilizados como prompts para generar nuevas imágenes similares. En este tutorial, se emplea el ComfyUITagger para descargar e instalar un etiquetador que le permita a ComfyUI interpretar y describir la imagen cargada.

Estas etiquetas ayudan a ajustar los prompts positivos proporcionando una descripción detallada del contenido de la imagen. Mediante el uso de un workflow específico, cargamos la imagen y obtenemos las etiquetas que nos servirán de base para futuras imágenes generadas.

Creación de Grupos y Workflow

El uso de grupos en ComfyUI permite organizar y manipular múltiples elementos de manera simultánea. Este método facilita la creación de diferentes secciones en el workflow, que pueden activarse o desactivarse según sea necesario. En el tutorial, creamos varios grupos para manejar los procesos de generación de imágenes y etiquetado por separado.

Esencialmente, los grupos permiten realizar un bypass de ciertos elementos, asegurando que solo se ejecuten las partes necesarias del workflow. Además, se muestra cómo copiar y mover elementos de un grupo a otro para mantener un flujo de trabajo organizado y eficiente.

Ajustes de Prompts y Semillas

Una parte crucial del proceso de generación de imágenes es definir correctamente los prompts y las semillas aleatorias. En el tutorial, se explican las ventajas de usar una semilla fija para asegurar la consistencia en las imágenes generadas. También se detalla la manera de ajustar los prompts para influir en las características de las imágenes.

Por ejemplo, modificar el prompt para intentar cambiar la edad de un retrato genera distintas variaciones de la imagen original. Este proceso permite personalizar cualquier característica de la imagen, desde la edad hasta el color de los ojos.

Mascarado de Imágenes (Inpainting)

El inpainting es una técnica que permite modificar solo ciertas partes de una imagen utilizando máscaras. En ComfyUI, esta técnica se emplea para cambiar detalles específicos como la expresión facial, el color de los ojos o incluso la ropa. El tutorial muestra cómo utilizar un editor de máscaras para seleccionar las zonas a modificar.

Esta técnica implica la creación de una máscara sobre las partes de la imagen que se desean cambiar y luego usar un encoder y sampler para generar las nuevas características. Este proceso es esencial para obtener resultados precisos y personalizados.

Pruebas y Resultados

Una vez configurado el workflow y aplicadas las máscaras, generamos diferentes versiones de la imagen original para observar cómo afectan los cambios. Se destaca la importancia de ajustar el nivel de “de-noise” para determinar el impacto que tiene la imagen de referencia en el resultado final.

Subir y bajar los niveles de de-noise puede permitirte mayor libertad creativa, desde mantener elementos específicos de la imagen de referencia hasta generar más variaciones basadas en el prompt. Esta flexibilidad es una de las mayores ventajas de usar ConfiUI para la manipulación de imágenes a niveles avanzados.

Conclusiones

En resumen, el uso de imágenes como referencia en ComfyUI amplía significativamente las posibilidades creativas a la hora de generar contenido visual con inteligencia artificial. Desde la instalación de herramientas especializadas como el Tagger hasta la creación de grupos y el uso de máscaras, este método te permite personalizar cada detalle de la imagen final.

A través de la configuración de diferentes modelos, prompts y niveles de de-noise, puedes obtener resultados precisos y a la medida de tus necesidades específicas. Esta técnica es especialmente útil para proyectos que requieran un alto grado de personalización y detalle, como retratos y modificaciones detalladas.

Resumen en Puntos Clave

  • 🛠️ Configuración de ComfyUI: Selección de modelos y configuración de elementos necesarios.
  • 📄 Etiquetado de Imágenes: Uso de Tagger para obtener descripciones detalladas de imágenes que se utilizarán como prompts.
  • 🗂️ Creación de Grupos: Organización de elementos y workflow para una gestión eficiente.
  • 🌱 Ajustes de Semillas: Utilización de semillas fijas para obtener consistencia en las imágenes generadas.
  • 🎨 Uso de Máscaras: Aplicación del inpainting para modificar características específicas de las imágenes.
¿Qué es el Image to Image?
Image to Image es una técnica que permite generar nuevas imágenes basadas en una imagen de referencia existente utilizando modelos de inteligencia artificial.
¿Cómo se utiliza un etiquetador (tagger) en ConfiUI?
El etiquetador, o tagger, permite generar descripciones textuales de una imagen que luego se usan como prompts. Se instala a través del manager de ConfiUI y se configura para etiquetar imágenes cargadas.
¿Qué es la semilla en la generación de imágenes?
La semilla es un valor numérico que asegura la consistencia en las imágenes generadas. Utilizar una semilla fija permite obtener resultados reproducibles.
¿Qué es el inpainting y cómo funciona?
El inpainting es una técnica que utiliza máscaras para modificar solo ciertas partes de una imagen. Este método permite realizar cambios específicos como la expresión facial o el color de los ojos.
¿Cómo puedo ajustar el impacto de la imagen de referencia en el resultado final?
El nivel de de-noise ajusta la influencia de la imagen de referencia en la generación de la nueva imagen. Bajos niveles de de-noise aseguran más similitud con la imagen original, mientras que niveles altos dan más libertad al prompt.

Si te interesa aprender más sobre esta y otras técnicas avanzadas de Inteligencia Artificial, no dudes en apuntarte a nuestra academia. Puedes empezar hoy mismo haciendo clic aquí.

Deja un comentario

Share to...