Cómo empezar con IA generativa visual en tu PC con NVIDIA RTX usando ComfyUI

La IA generativa visual ha pasado de ser algo experimental a convertirse en una parte habitual del flujo de trabajo de creadores, estudios y profesionales que trabajan con imagen y vídeo. Modelos de imagen ofrecen resultados fotorealistas de forma consistente, los modelos de vídeo ya generan clips largos y coherentes, y ambos son capaces de seguir direcciones creativas bastante precisas.

Una de las grandes tendencias que destaca NVIDIA es que cada vez más creadores están ejecutando estos flujos de trabajo localmente en sus PCs con GPU RTX, manteniendo sus recursos bajo control, eliminando costes de servicios en la nube y reduciendo la fricción a la hora de iterar. En este post vamos a ver cómo dar tus primeros pasos con ComfyUI y modelos como FLUX.2 y LTX‑2 en un PC con NVIDIA RTX, basándonos en la guía publicada en el blog oficial de NVIDIA.


Por qué montar tu flujo de IA visual en local

Trabajar con IA visual en local tiene varias ventajas claras frente a depender exclusivamente de servicios cloud:

  • Control total sobre tus activos: imágenes, vídeos y modelos se quedan en tu máquina o en tu almacenamiento, no en un servicio de terceros.
  • Sin costes por tokens ni suscripciones de uso de modelo: una vez descargados, puedes iterar tanto como quieras sin miedo a “gastar créditos”.
  • Menos fricción creativa: al no depender de latencia de red ni límites de API, puedes ajustar prompts, parámetros y workflows a la velocidad que exige un proyecto real.

Los PCs con NVIDIA RTX se han convertido en referencia para este tipo de carga precisamente porque combinan potencia de GPU, buena gestión de VRAM y optimizaciones específicas para inferencia de modelos de IA generativa.


Qué es ComfyUI y qué vamos a montar

ComfyUI es una herramienta de la comunidad open source que simplifica la creación de flujos avanzados de IA generativa visual mediante un sistema de nodos conectados. Cada nodo representa una parte del pipeline (modelo, prompt, sampler, guardado de imagen, etc.) y se pueden encadenar para construir workflows complejos sin programar.

Desde ComfyUI es posible descargar y utilizar algunos de los modelos más potentes disponibles hoy en día, como FLUX.2 para generación de imágenes y LTX‑2 para generación de vídeo, además de workflows compartidos por la comunidad. El objetivo de este post es que puedas:

  • Instalar ComfyUI en Windows.
  • Generar tus primeras imágenes con una plantilla básica de texto a imagen.
  • Entender qué papel juega tu GPU RTX y la VRAM a la hora de elegir modelos.
  • Tener claro cómo dar el salto después a vídeo y pipelines más avanzados.

Primeros pasos: instalación y primera imagen

NVIDIA propone un camino muy directo para empezar con IA generativa visual en un PC con RTX usando ComfyUI.

1. Instalar ComfyUI

  • Visita la web oficial de ComfyUI en comfy.org y descarga el instalador para Windows.
  • Completa la instalación siguiendo el asistente y, una vez instalado, lanza ComfyUI desde tu PC.

2. Usar la plantilla de inicio (texto a imagen)

ComfyUI incluye plantillas preconfiguradas para que no tengas que construir el workflow desde cero.

  • Haz clic en el botón “Templates” dentro de ComfyUI.
  • Dentro de la sección “Getting Started”, selecciona la plantilla “1.1 Starter – Text to Image”.
  • Verás un conjunto de nodos ya conectados: uno para el modelo, otro para el prompt, el sampler y un nodo final para guardar la imagen.

Asegúrate de que el “Model Node” está conectado al “Save Image Node”; los nodos funcionan en cadena, pasando la información de uno a otro hasta que la imagen final se genera y se guarda.

Con la plantilla cargada:

  • Pulsa el botón azul “Run”.
  • Observa cómo los nodos se van iluminando en verde a medida que tu PC con RTX ejecuta el flujo y genera la primera imagen.

A partir de aquí, el siguiente paso es cambiar el prompt de texto y volver a ejecutar el pipeline para explorar cómo responde el modelo a distintas instrucciones creativas.


VRAM, tamaños de modelo y GPUs RTX

En cuanto empiezas a usar modelos más avanzados en ComfyUI, la capacidad de VRAM de tu GPU se vuelve un factor crítico. No todos los modelos caben en todas las GPUs, y elegir el formato correcto marca la diferencia entre un flujo fluido y errores por falta de memoria.

El artículo de NVIDIA ofrece unas pautas generales muy útiles:

  • Los modelos grandes (como ciertas variantes de FLUX.2) pueden superar los 30 GB de pesos, por lo que requieren GPUs con mucha VRAM o formatos de precisión reducida.
  • En GPUs GeForce RTX 50 Series se recomiendan modelos en FP4, y en GPUs RTX 40 Series modelos en FP8, lo que permite usar menos VRAM manteniendo un buen rendimiento.

En la práctica, esto implica:

  • Verificar cuánta VRAM tiene tu GPU antes de descargar modelos muy pesados.
  • Priorizar versiones comprimidas/optimizadas cuando trabajes en tarjetas más modestas.

ComfyUI se encarga de gestionar la descarga de pesos desde repositorios como Hugging Face: cuando seleccionas un workflow que requiere FLUX.2, aparecerá un diálogo guiando el proceso de descarga y guardando automáticamente los archivos de pesos (.safetensors) en las carpetas correctas de ComfyUI.


Mejorando la calidad de imagen con FLUX.2

Una vez controlada la plantilla básica de texto a imagen, puedes pasar a workflows más avanzados como “FLUX.2 Dev Text to Image”, que NVIDIA menciona explícitamente en su guía.

  • Desde “Templates”, entra en “All Templates” y busca “FLUX.2 Dev Text to Image”.
  • Selecciona la plantilla y ComfyUI cargará un workflow más completo pensado para exprimir la calidad del modelo FLUX.2‑Dev.

Al cargarlo por primera vez:

  • ComfyUI detectará que faltan los pesos del modelo y te mostrará un asistente para descargarlos.
  • Ten en cuenta que pueden ser archivos grandes, por lo que necesitarás espacio en disco y algo de tiempo para que la descarga se complete.

En términos conceptuales, los pesos del modelo son la “memoria” de la red neuronal: los valores numéricos que almacenan lo que el modelo aprendió durante el entrenamiento a partir de millones de imágenes. ComfyUI no incluye esos pesos de serie, sino que los va descargando bajo demanda según los workflows que uses.


Del texto a la imagen y de la imagen al vídeo con LTX‑2

Además de generar imágenes, NVIDIA destaca el uso de LTX‑2 para generación de vídeo dentro de ComfyUI. La idea es construir workflows que encadenen:

  • Un modelo de generación de imagen (por ejemplo FLUX.2) para producir un fotograma de alta calidad.
  • Un workflow de LTX‑2 que tome esa imagen como entrada y genere un clip de vídeo coherente a partir de ella.

Un patrón habitual es:

  • Copiar el nodo de salida de imagen de FLUX.2 (por ejemplo, el nodo finales del workflow de texto a imagen).
  • Pegar ese nodo dentro del workflow de LTX‑2 Image to Video.
  • Conectar el punto de salida de imagen de FLUX.2 al nodo de entrada de imagen de LTX‑2 (por ejemplo, al nodo de resize o entrada de máscara).

De esta forma, puedes guardar un workflow combinado que genere imagen y vídeo en una misma ejecución, a partir de un solo prompt.


Siguientes pasos: 3D y pipelines avanzados

Más allá de la combinación de imagen y vídeo, NVIDIA propone un siguiente nivel: añadir guía 3D a tus pipelines de IA generativa.

En su artículo enlazan al NVIDIA Blueprint for 3D‑guided generative AI, que muestra cómo usar escenas y assets 3D para dirigir pipelines de imagen y vídeo con un nivel de control más cercano a producción. Estos blueprints incluyen workflows listos para usar en RTX PCs que puedes estudiar, modificar y extender según tus necesidades.

La comunidad alrededor de ComfyUI también es muy activa, y NVIDIA recomienda dos puntos de encuentro clave para aprender, compartir y resolver dudas:

  • El subreddit de Stable Diffusion, donde se comparten modelos, técnicas y ejemplos de workflows.
  • El servidor de Discord de ComfyUI, donde los usuarios intercambian nodos, plantillas y buenas prácticas.

Referencias y recursos

Este artículo se inspira y resume la guía oficial de NVIDIA: “How to Get Started With Visual Generative AI on NVIDIA RTX PCs”, publicada en el NVIDIA Blog, donde se detalla paso a paso cómo usar ComfyUI junto a modelos como FLUX.2 y LTX‑2 sobre GPUs RTX.

Si quieres profundizar en las últimas novedades de IA en PCs RTX (optimización de modelos, novedades anunciadas en CES, variantes FLUX.2 optimizadas, Project G‑Assist, etc.), te recomiendo revisar también la sección de Generative AI del NVIDIA Blog y sus recursos específicos para creadores.