Hunyuan Video 1.5 — Modelo AI sin censura

Q: ¿Qué es HunyuanVideo 1.5 y cómo se compara con otros modelos de IA de texto a video?

HunyuanVideo 1.5 es un modelo de difusión de video de 8.3B parámetros desarrollado por Tencent. Produce resultados de texto a video y de imagen a video de alta calidad, comparables con modelos más grandes, mientras se ejecuta de manera eficiente en GPUs de consumo.

Q: ¿Cómo puedo instalar y ejecutar HunyuanVideo 1.5 en ComfyUI usando una GPU de consumo?

Puedes instalar HunyuanVideo 1.5 colocando sus archivos de modelo en las carpetas correctas de ComfyUI y usando las plantillas oficiales de flujo T2V o I2V. Funciona en GPUs de 8GB–24GB, y se recomienda usar la versión Nightly de ComfyUI para compatibilidad total.

Q: ¿Cuáles son las diferencias entre las variantes (cosy) de HunyuanVideo 1.5, incluyendo GGUF y las builds de 5G?

Las variantes cosy incluyen builds GGUF para GPUs de 8–12GB, una build de 5G para sistemas con 5GB de VRAM, y una versión completa para GPUs de 16–24GB. Estas versiones emplean cuantización para expandir la compatibilidad con hardware sin modificar los pesos originales del modelo.

Q: ¿HunyuanVideo 1.5 está sin censura y qué eliminan o modifican las builds comunitarias?

Las versiones oficiales incluyen filtros de seguridad, pero las builds comunitarias cosy eliminan el bloqueo NSFW, restricciones de prompts y clasificadores de seguridad. Los pesos del modelo base permanecen intactos, permitiendo prompts sin restricciones.

Q: ¿Qué hardware necesito para generar videos con HunyuanVideo 1.5 en una GPU de baja VRAM?

GPUs de baja VRAM como modelos de 6GB u 8GB pueden ejecutar HunyuanVideo 1.5 usando las builds GGUF o 5G cosy. Para la máxima calidad y precisión completa, se recomiendan GPUs de 16–24GB como las RTX 3090, 4080 o 4090.

Hunyuan Video 1.5 es uno de los mejores modelos de generación de vídeo de código abierto

Hunyuan Video 1.5 es el revolucionario modelo de generación de vídeo con 8,3 mil millones de parámetros de Tencent, diseñado para ofrecer resultados de conversión de texto a vídeo e imagen a vídeo de alta calidad, a la vez que se ejecuta en GPU aptas para consumidores.

Su disponibilidad de código abierto también ha permitido una serie de variantes comunitarias, como la (acogedor) Hunyuan 1.5 familia, incluidas las compilaciones de GGUF que funcionan con tan poco como 8 GB DE VRAMy configuraciones optimizadas para 5G para inferencias extremadamente rápidas.

Feature	Description
8.3B Parameters	Compact compared to 12–40B video models, yet delivers flagship-level quality
720p Native Output	Generates 5–10 second clips with 1080p super-resolution upscaling
Text-to-Video (T2V)	Produces cinematic sequences from natural language prompts
Image-to-Video (I2V)	Animates still images with motion, physics, and camera control
Multilingual Text Rendering	Supports both Chinese and English inside scenes
High Prompt Accuracy	Excellent with camera paths, physics, emotions, pacing
Open Source	Free, modifiable, and supported by an active community

Explicación de las variantes de Cosyflow de Hunyuan Video 1.5

Dirigido por la comunidad acogedor lanza el reempaquetado de Hunyuan Video 1.5 para una variedad de hardware y casos de uso. Estas versiones no son compilaciones oficiales de Tencent, sino que son comodidades para la comunidad.

(cosy) Hunyuan 1.5 Texto a vídeo

Compilación comunitaria predeterminada.
La mejor calidad y precisión total para el modelo 8,3B.
Recomendado para 16 A 24 GB DE VRAM GPUs.
El mismo comportamiento y calidad de salida que la implementación de referencia completa.

(cosy) Hunyuan 1.5 Texto a vídeo (GGUF)

Versión cuantificada GGUF (similar a los formatos de cuantificación LLM).
Tamaño de RAM/VRAM mucho menor.
Ideal para usuarios con 8 A 12 GB DE VRAM GPUs.
Ligera reducción de calidad, pero considerablemente más rápida y ligera.

(acogedor) Hunyuan 1.5 de texto a vídeo (versión GGUF de 8 GB de VRAM)

Optimizado específicamente para GPU NVIDIA de 8 GB (p. ej., RTX 3070, 4060).
Utiliza una cuantificación agresiva.
Compensaciones:
- Menor fidelidad de movimiento
- Algunos artefactos en el movimiento de cámara a alta velocidad
- Imágenes un poco más suaves

Sigue siendo notablemente bueno para sus requisitos de hardware.

(cosy) Hunyuan 1.5 Texto a video (5G)

«5G» significa Objetivo de VRAM de 5 gigabytes.
Ultraligero, optimizado de forma agresiva.
Útil para:
- GPU para portátiles
- Instancias de nivel gratuito en la nube
- Mini-PC de formato pequeño
La pérdida de calidad es notable, pero sigue siendo funcional para previsualizaciones de conceptos o iteraciones rápidas.

Por qué la gente llama a estos videos de Hunyuan «sin censura»

La versión oficial de Tencent se rige por las restricciones de contenido estándar (similares a las de Stable Diffusion 1.5 y 3.0). Las compilaciones del flujo de trabajo eliminan los filtros restrictivos, lo que permite su uso sin bloquear el contenido:

Sin puntos de control de clasificación de seguridad
Sin enmascaramiento automático NSFW
Sin desinfección inmediata

⚠️ Esto no altera las ponderaciones del modelo subyacente. El modelo no ha sido entrenado en contenido explícito, pero ahora acepta ninguna indica sin bloquear.

Hunyuan Video 1.5 utiliza un canal de difusión multietapa optimizado:

Vínculos modelo

codificadores de texto

modelos_de_difusión

jarrón

hunyuanvideo15_vae_fp16.safe tensores

:open_file_folder: ComfyUI/
├── :open_file_folder: models/
│   ├── :open_file_folder: text_encoders/
│   │      ├── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   │      └── byt5_small_glyphxl_fp16.safetensors
│   ├── :open_file_folder: diffusion_models/
│   │      ├── hunyuanvideo1.5_1080p_sr_distilled_fp16.safetensors
│   │      └── hunyuanvideo1.5_720p_t2v_fp16.safetensors
│   └── :open_file_folder: vae/
│          └── hunyuanvideo15_vae_fp16.safetensors

plantillas de flujo de trabajo

Texto a vídeo: video_hunyuan_video_1.5_720p_t2v.json
De imagen a vídeo: video_hunyuan_video_1.5_720p_i2v.json

Si ComfyUI no puede encontrar los nodos:

Actualizar a Todas las noches
Asegúrese de que no haya fallado la importación de extensiones al inicio
Asegúrese de que la plantilla existe en su versión

HunYuanVideo 1.5 es actualmente uno de los más accesible, de alta calidad, y de código abierto modelos de vídeo disponibles, mientras que sus variantes «acogedoras» para la comunidad permiten el uso sin censura y las implementaciones con poca VRAM.

Limitaciones a esperar

Aunque potente, HunYuanVideo 1.5 tiene algunas limitaciones:

Los vídeos de más de 10 segundos pierden calidad
El movimiento rápido puede provocar fluctuaciones temporales
Los detalles finos pueden «fundirse» en todos los marcos
Las versiones GGUF reducen ligeramente la fidelidad
Las interacciones de objetos complejos no son perfectas

GPU	VRAM	Expected Performance
RTX 4090	24GB	Full precision, fastest generation
RTX 3090 / 4080	16–24GB	Produces full-quality results

Minimum (GGUF builds)

GPU	VRAM	Notes
RTX 4060 / 3070	8GB	Works with GGUF 8GB version
Laptop GPUs	6GB	5G build only

‍

Preguntas Frecuentes

¿Qué es HunyuanVideo 1.5 y cómo se compara con otros modelos de IA de texto a video?

HunyuanVideo 1.5 es el modelo de difusión de video open-source de 8.3B parámetros de Tencent, diseñado para generación de texto a video e imagen a video. En comparación con modelos más grandes (12–40B), ofrece calidad cinematográfica similar mientras funciona de manera eficiente en GPUs de consumo, convirtiéndolo en uno de los modelos T2V de mayor calidad y más accesibles disponibles.

¿Cómo puedo instalar y ejecutar HunyuanVideo 1.5 en ComfyUI usando una GPU de consumo?

HunyuanVideo 1.5 puede instalarse colocando los text encoders, modelos de difusión y archivos VAE dentro del directorio models/ de ComfyUI. Usando las plantillas de flujo (T2V o I2V), los creadores pueden generar videos en 720p o 1080p en GPUs de 8GB a 24GB de VRAM. Actualizar ComfyUI a la versión Nightly garantiza compatibilidad total.

¿Cuáles son las diferencias entre las variantes (cosy) de HunyuanVideo 1.5, incluyendo GGUF y las builds de 5G?

Las variantes cosy ofrecen diferentes niveles de rendimiento: las builds GGUF funcionan con 8–12GB de VRAM mediante cuantización; la versión 5G corre con tan solo 5GB de VRAM para laptops y servicios gratuitos en la nube; y el modelo completo ofrece máxima fidelidad para GPUs de 16–24GB. Estas versiones comunitarias amplían la compatibilidad sin modificar el modelo base.

¿HunyuanVideo 1.5 está sin censura y qué eliminan o modifican las builds comunitarias?

Aunque la versión oficial de Tencent incluye restricciones de contenido como filtros de seguridad, las builds comunitarias cosy eliminan el bloqueo de prompts, filtros NSFW y clasificadores de seguridad. Los pesos del modelo permanecen intactos —lo que significa que el modelo no está entrenado con contenido explícito, pero ya no bloquea prompts.

¿Qué hardware necesito para generar videos con HunyuanVideo 1.5 en una GPU de baja VRAM?

HunyuanVideo 1.5 puede ejecutarse en GPUs con tan solo 6–8GB de VRAM usando las builds GGUF o 5G cosy. Para obtener la mejor calidad, se recomiendan GPUs de 16–24GB como las RTX 3090, 4080 o 4090. Estas variantes permiten la generación T2V en laptops y sistemas económicos.

Escrito por:

Eden

Eden era una artista entrenada que alguna vez temió que el arte de la inteligencia artificial terminara con su carrera, y desde entonces lo ha adoptado como un fuerte aliado. Ahora está innovando con confianza utilizando la inteligencia artificial, combinando tradición y tecnología en su trabajo.

Pruebe Promptus Cosy UI hoy gratis.

Wikis

modelo de control de movimiento dreamactor m2.0 AI

Claudia Perez

Noticias

Simplemente crea tu próximo video de IA con Promptus

Go from idea to production-ready output in minutes.

Empieza a usar Promptus ➜