WAN 2.2 en Promptus ComfyUI Studio

Generación de vídeo mediante IA con WAN 2.2 en Promptus ComfyUI Studio: una guía paso a paso para creadores y empresas emergentes

A medida que crece la demanda de vídeos dinámicos y de alta calidad generados por IA, los profesionales creativos y las empresas emergentes buscan herramientas que les permitan crear prototipos, iterar y producir contenido sin grandes inversiones en equipos de producción ni equipos costosos. Ingresa WAN 2.2 — un modelo de IA de código abierto que revoluciona la generación de vídeo con sus capacidades de conversión de texto a vídeo e imagen a vídeo. En este artículo, veremos cómo puedes usar WAN 2.2 en su interior Estudio Promptus ComfyUI, diseñado para creadores profesionales y empresas emergentes que buscan crear activos digitales únicos para las redes sociales y más allá.

🔍 ¿Qué es WAN 2.2 y por qué es importante?

WAN 2.2 es el último avance en la creación de vídeo basada en inteligencia artificial. A diferencia de los métodos tradicionales que requieren configuraciones complejas y hardware especializado, la WAN 2.2 aprovecha la potencia de la IA para crear vídeos cinematográficos de 720p desde entradas de texto o imagen. Mediante el uso Mezcla de expertos (MoE) arquitectura, WAN 2.2 combina expertos en alto nivel de ruido para la estructuración de la escena global y expertos en bajo nivel de ruido para obtener detalles detallados, que garantizan tanto la creatividad como la precisión. Esto es lo que aporta:

Control cinematográfico: Ajusta sin problemas la iluminación, la composición y la gradación del color para obtener vídeos de calidad profesional.
Movimiento suave y complejo: Ya se trate de varios objetos o de escenas dinámicas, la WAN 2.2 sobresale en la generación de movimiento que se ajusta a la semántica de las escenas.
Compresión eficiente: El Modelo 5B apalancamientos VAE de alta compresión, lo que le permite ejecutarse en GPU con solo 8 GB DE VRAM.

Gracias a su Licencia de código abierto Apache-2.0, WAN 2.2 no es solo una potente herramienta para uso personal, sino que es perfecta para empresas emergentes, marcas y agencias creativas que buscan integrar la generación de vídeo basada en inteligencia artificial en sus flujos de trabajo.

🧠 Elige el modelo correcto

La WAN 2.2 viene con varias variantes de modelo, cada una de las cuales se adapta a diferentes necesidades y capacidades de hardware. He aquí un desglose:

Variant (use)	Parameters	VRAM (approx.)	Notes
TI2V-5B (Text & Image to Video)	5B	≥ 8GB	Hybrid model; generates 720p videos; high-compression VAE
I2V-A14B (Image to Video)	14B	≥ 16GB	High detail, FP16/FP8 versions; ideal for image-only inputs
T2V-A14B (Text to Video)	14B	≥ 16GB	For pure text-to-video generation, requires powerful GPU

Para creadores con 8 GB DE VRAM, el TI2V-5B La variante es un excelente punto de partida. Ofrece flexibilidad tanto para las entradas de texto como de imágenes, y produce vídeo de alta calidad incluso en sistemas de gama media. Para obtener una salida más detallada o si tiene acceso a hardware de gama alta, considere la 14B modelos para la generación de vídeos basados en texto e imágenes.

🛠️ Cómo configurarlo en ComfyUI

Comenzar a usar WAN 2.2 en ComfyUI Studio es sencillo, pero estos son los pasos esenciales para garantizar una configuración fluida y unos resultados óptimos:

Actualiza ComfyUI — Asegúrese de que está utilizando la última versión de desarrollo de ComfyUI. WAN 2.2 presenta nuevas nodos de flujo de trabajo y optimizaciones de memoria (aproximadamente un 10% menos de VRAM utilizada durante la decodificación de VAE).
Cargar plantillas WAN 2.2 — En ComfyUI, navega hasta Flujo de trabajo → Buscar plantillas → Vídeo y seleccione la plantilla adecuada según sus necesidades:
- WAN 2.2 Texto a vídeo
- WAN 2.2 Imagen a vídeo
- Generación de vídeo WAN 2.2 5B
Descargar modelos — Cuando se le solicite, permita a ComfyUI buscar los modelos necesarios o descargarlos manualmente:
- Modelos de alto y bajo nivel de ruido (p. ej., Tensores WAN2.2_I2V_High_Noise_14B_FP8_scaled.safe)
- JARRÓN (p. ej., wan_2.1_vae.safetensores)
- Codificadores de texto CLIP/UMT5 (p. ej., tensores umt5_xxl_fp8_e4m3fn_scaled.safe)
- Archivos LoRa (p. ej., LightX2V para mejorar el movimiento)
Abrir y ejecutar el flujo de trabajo — Arrastra y suelta el .json archivo de flujo de trabajo en el editor de nodos de ComfyUI. Una vez que los modelos estén cargados, pulse Corre para empezar a generar tu primer vídeo.

Configuración esencial del flujo de trabajo 🧾

Aunque las plantillas de ComfyUI están preconfiguradas, la personalización es clave para obtener los mejores resultados:

1. Movimiento rápido y de cámara

Sea descriptivo en su mensaje. Para los flujos de trabajo de imagen a vídeo (I2V), sube una imagen que capture la pose, la composición y el estado de ánimo que deseas. Añade indicaciones cinematográficas como «acercar», «desplazar a la izquierda» o «inclinar hacia arriba» para controlar el movimiento de la cámara. Por ejemplo:

«La escena comienza con un primer plano de una persona girando los hombros, la cámara se acerca lentamente mientras se desplaza hacia la derecha, capturando los detalles del fondo a medida que avanza la escena».

2. Resolución y duración del vídeo

Elige la resolución de vídeo (p. ej., 1280 × 720) y el recuento de fotogramas (p. ej., 121 marcos). A 24 fps, 121 fotogramas producen un vídeo de 5 segundos. Reduzca la resolución y el número de fotogramas si está trabajando con 8 GB DE VRAM sistemas para evitar cuellos de botella de memoria.

3. Expertos en alto nivel de ruido versus expertos en bajo nivel de ruido

La WAN 2.2 utiliza dos modelos expertos para las diferentes etapas de la generación de vídeo:

Experto en alto nivel de ruido: añade movimiento y variación creativos durante las primeras etapas de eliminación de ruido.
Experto en bajo nivel de ruido: refina los detalles en etapas posteriores, aportando claridad a la escena.

4. Control de fuerza y movimiento de LoRa

Los LoRA (modelos de adaptación de rango bajo) mejoran el movimiento en los vídeos. Establece la fuerza de LoRa entre 0,8—1,0 para controlar la intensidad del estilo de movimiento. Por ejemplo, un ajuste preestablecido de LoRa podría simular el movimiento de una cámara portátil o la iluminación cinematográfica.

5. Indicaciones negativas

Para evitar artefactos no deseados (como vídeos de baja calidad), especifica indicaciones negativas como «sin marcas de agua», «sin texto» o «evitar distorsiones» para obtener resultados más nítidos.

6. Ahorro y exportación

Usa el Guardar vídeo nodo para almacenar tus vídeos generados en formatos como mp4 con H.264 códec para compartir fácilmente entre plataformas.

Consejos para usuarios de 8 GB de VRAM 💡

Para quienes trabajan con recursos limitados, estos consejos les ayudarán a obtener el mejor rendimiento de WAN 2.2:

Elige el modelo 5B: La variante 5B está optimizada para un rendimiento con un menor uso de memoria.
Reduzca la resolución y el número de fotogramas: Intente usar 512 x 512 resolución y menos fotogramas para evitar cuellos de botella en la VRAM.
Cerrar aplicaciones en segundo plano: Supervise de cerca el uso de la VRAM durante la generación para garantizar un funcionamiento sin problemas.

🚀 Funciones avanzadas y mejores prácticas

La WAN 2.2 ofrece una gama de funciones avanzadas para ayudarlo a ajustar sus vídeos y lograr resultados más cinematográficos:

Estética cinematográfica: Controla la iluminación, la gradación del color y la composición para que coincidan con el ambiente del vídeo (por ejemplo, «iluminación de la hora dorada», «verde azulado y naranja intensos»).
Control semántico preciso: La WAN 2.2 se destaca en el reconocimiento de escenas complejas y varios objetos, por lo que es ideal para crear vídeos narrativos detallados.
Entrenamiento LoRa: Si necesitas estilos específicos, entrena tus propios LoRas para lograr un control preciso del movimiento o la dirección artística.
Optimización de memoria: Las nuevas plantillas de ComfyUI garantizan hasta un 10% menos de uso de VRAM, lo que facilita la ejecución en GPU para consumidores.

🎨 Por qué WAN 2.2 es importante para los creadores y las empresas emergentes

La WAN 2.2 desbloquea un enorme potencial para los creadores independientes y las empresas emergentes al permitir la creación de contenido de vídeo de alta calidad sin la necesidad de costosos recursos de producción. He aquí por qué es importante:

Prototipado: Cree rápidamente anuncios animados, tablas de ideas o vídeos explicativos para presentaciones para clientes.
Experimentación de marca: Pon a prueba la estética de la marca y la narración visual sin el coste de un equipo de producción completo.
Escalabilidad: Amplíe desde ordenadores de escritorio hasta configuraciones de GPU basadas en la nube a medida que aumenten sus necesidades, con las opciones de modelo flexibles y la accesibilidad de código abierto de WAN 2.2.

Ya sea que esté produciendo contenido para redes sociales, publicidad o desarrollo de marca, WAN 2.2 en Estudio Promptus ComfyUI proporciona una herramienta eficaz y potente para impulsar su visión creativa.

📝 Resumen

Para empezar a usar WAN 2.2 en Estudio Promptus ComfyUI, actualice su ComfyUI, seleccione la plantilla WAN 2.2 adecuada y cargue los modelos necesarios. Personalice la configuración para obtener una claridad inmediata, el movimiento de la cámara y las variantes del modelo en función de la VRAM de su sistema. Al seguir este flujo de trabajo, puede generar rápidamente contenido de vídeo cinematográfico para cualquier proyecto, utilizando solo un mensaje de texto o una entrada de imagen.

¿Estás listo para crear impresionantes vídeos generados por IA? Deje que WAN 2.2 entre Estudio Promptus ComfyUI ¡sea su herramienta preferida!

Escrito por:

Duni

Duni est ingénieure en informatique et en intelligence artificielle chez Promptus, spécialisée dans la conception de flux de travail basés sur l'IA. Duni crée et documente des flux de travail qui permettent aux créateurs de repousser les limites du possible avec Promptus et ComfyUI.

Pruebe Promptus Cosy UI hoy gratis.