vídeo hunyuan 1.5
Eden
Hunyuan

Hunyuan Video 1.5 — Modelo #1 de código abierto y sin censura

Promptus
5 min
Wiki 251
promptus ai video generator

Hunyuan Video 1.5 es uno de los mejores modelos de generación de vídeo de código abierto

Hunyuan Video 1.5 es el revolucionario modelo de generación de vídeo con 8,3 mil millones de parámetros de Tencent, diseñado para ofrecer resultados de conversión de texto a vídeo e imagen a vídeo de alta calidad, a la vez que se ejecuta en GPU aptas para consumidores.

Su disponibilidad de código abierto también ha permitido una serie de variantes comunitarias, como la (acogedor) Hunyuan 1.5 familia, incluidas las compilaciones de GGUF que funcionan con tan poco como 8 GB DE VRAMy configuraciones optimizadas para 5G para inferencias extremadamente rápidas.

Feature Description
8.3B Parameters Compact compared to 12–40B video models, yet delivers flagship-level quality
720p Native Output Generates 5–10 second clips with 1080p super-resolution upscaling
Text-to-Video (T2V) Produces cinematic sequences from natural language prompts
Image-to-Video (I2V) Animates still images with motion, physics, and camera control
Multilingual Text Rendering Supports both Chinese and English inside scenes
High Prompt Accuracy Excellent with camera paths, physics, emotions, pacing
Open Source Free, modifiable, and supported by an active community


Explicación de las variantes de Cosyflow de Hunyuan Video 1.5

Dirigido por la comunidad acogedor lanza el reempaquetado de Hunyuan Video 1.5 para una variedad de hardware y casos de uso. Estas versiones no son compilaciones oficiales de Tencent, sino que son comodidades para la comunidad.

(cosy) Hunyuan 1.5 Texto a vídeo

  • Compilación comunitaria predeterminada.
  • La mejor calidad y precisión total para el modelo 8,3B.
  • Recomendado para 16 A 24 GB DE VRAM GPUs.
  • El mismo comportamiento y calidad de salida que la implementación de referencia completa.

(cosy) Hunyuan 1.5 Texto a vídeo (GGUF)

  • Versión cuantificada GGUF (similar a los formatos de cuantificación LLM).
  • Tamaño de RAM/VRAM mucho menor.
  • Ideal para usuarios con 8 A 12 GB DE VRAM GPUs.
  • Ligera reducción de calidad, pero considerablemente más rápida y ligera.

(acogedor) Hunyuan 1.5 de texto a vídeo (versión GGUF de 8 GB de VRAM)

  • Optimizado específicamente para GPU NVIDIA de 8 GB (p. ej., RTX 3070, 4060).
  • Utiliza una cuantificación agresiva.
  • Compensaciones:
    • Menor fidelidad de movimiento
    • Algunos artefactos en el movimiento de cámara a alta velocidad
    • Imágenes un poco más suaves

Sigue siendo notablemente bueno para sus requisitos de hardware.

(cosy) Hunyuan 1.5 Texto a video (5G)

  • «5G» significa Objetivo de VRAM de 5 gigabytes.
  • Ultraligero, optimizado de forma agresiva.
  • Útil para:
    • GPU para portátiles
    • Instancias de nivel gratuito en la nube
    • Mini-PC de formato pequeño
  • La pérdida de calidad es notable, pero sigue siendo funcional para previsualizaciones de conceptos o iteraciones rápidas.

Por qué la gente llama a estos videos de Hunyuan «sin censura»

La versión oficial de Tencent se rige por las restricciones de contenido estándar (similares a las de Stable Diffusion 1.5 y 3.0). Las compilaciones del flujo de trabajo eliminan los filtros restrictivos, lo que permite su uso sin bloquear el contenido:

  • Sin puntos de control de clasificación de seguridad
  • Sin enmascaramiento automático NSFW
  • Sin desinfección inmediata

⚠️ Esto no altera las ponderaciones del modelo subyacente. El modelo no ha sido entrenado en contenido explícito, pero ahora acepta ninguna indica sin bloquear.

Hunyuan Video 1.5 utiliza un canal de difusión multietapa optimizado:

Vínculos modelo

codificadores de texto

modelos_de_difusión

jarrón

:open_file_folder: ComfyUI/
├── :open_file_folder: models/
│   ├── :open_file_folder: text_encoders/
│   │      ├── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   │      └── byt5_small_glyphxl_fp16.safetensors
│   ├── :open_file_folder: diffusion_models/
│   │      ├── hunyuanvideo1.5_1080p_sr_distilled_fp16.safetensors
│   │      └── hunyuanvideo1.5_720p_t2v_fp16.safetensors
│   └── :open_file_folder: vae/
│          └── hunyuanvideo15_vae_fp16.safetensors

plantillas de flujo de trabajo

Si ComfyUI no puede encontrar los nodos:

  • Actualizar a Todas las noches
  • Asegúrese de que no haya fallado la importación de extensiones al inicio
  • Asegúrese de que la plantilla existe en su versión

HunYuanVideo 1.5 es actualmente uno de los más accesible, de alta calidad, y de código abierto modelos de vídeo disponibles, mientras que sus variantes «acogedoras» para la comunidad permiten el uso sin censura y las implementaciones con poca VRAM.

Limitaciones a esperar

Aunque potente, HunYuanVideo 1.5 tiene algunas limitaciones:

  • Los vídeos de más de 10 segundos pierden calidad
  • El movimiento rápido puede provocar fluctuaciones temporales
  • Los detalles finos pueden «fundirse» en todos los marcos
  • Las versiones GGUF reducen ligeramente la fidelidad
  • Las interacciones de objetos complejos no son perfectas

Recommended

GPU VRAM Expected Performance
RTX 4090 24GB Full precision, fastest generation
RTX 3090 / 4080 16–24GB Produces full-quality results

Minimum (GGUF builds)

GPU VRAM Notes
RTX 4060 / 3070 8GB Works with GGUF 8GB version
Laptop GPUs 6GB 5G build only

Preguntas Frecuentes

¿Qué es HunyuanVideo 1.5 y cómo se compara con otros modelos de IA de texto a video?

+

HunyuanVideo 1.5 es el modelo de difusión de video open-source de 8.3B parámetros de Tencent, diseñado para generación de texto a video e imagen a video. En comparación con modelos más grandes (12–40B), ofrece calidad cinematográfica similar mientras funciona de manera eficiente en GPUs de consumo, convirtiéndolo en uno de los modelos T2V de mayor calidad y más accesibles disponibles.

¿Cómo puedo instalar y ejecutar HunyuanVideo 1.5 en ComfyUI usando una GPU de consumo?

+

HunyuanVideo 1.5 puede instalarse colocando los text encoders, modelos de difusión y archivos VAE dentro del directorio models/ de ComfyUI. Usando las plantillas de flujo (T2V o I2V), los creadores pueden generar videos en 720p o 1080p en GPUs de 8GB a 24GB de VRAM. Actualizar ComfyUI a la versión Nightly garantiza compatibilidad total.

¿Cuáles son las diferencias entre las variantes (cosy) de HunyuanVideo 1.5, incluyendo GGUF y las builds de 5G?

+

Las variantes cosy ofrecen diferentes niveles de rendimiento: las builds GGUF funcionan con 8–12GB de VRAM mediante cuantización; la versión 5G corre con tan solo 5GB de VRAM para laptops y servicios gratuitos en la nube; y el modelo completo ofrece máxima fidelidad para GPUs de 16–24GB. Estas versiones comunitarias amplían la compatibilidad sin modificar el modelo base.

¿HunyuanVideo 1.5 está sin censura y qué eliminan o modifican las builds comunitarias?

+

Aunque la versión oficial de Tencent incluye restricciones de contenido como filtros de seguridad, las builds comunitarias cosy eliminan el bloqueo de prompts, filtros NSFW y clasificadores de seguridad. Los pesos del modelo permanecen intactos —lo que significa que el modelo no está entrenado con contenido explícito, pero ya no bloquea prompts.

¿Qué hardware necesito para generar videos con HunyuanVideo 1.5 en una GPU de baja VRAM?

+

HunyuanVideo 1.5 puede ejecutarse en GPUs con tan solo 6–8GB de VRAM usando las builds GGUF o 5G cosy. Para obtener la mejor calidad, se recomiendan GPUs de 16–24GB como las RTX 3090, 4080 o 4090. Estas variantes permiten la generación T2V en laptops y sistemas económicos.

Simplemente crea tu próximo video de IA con Promptus
Empieza a usar Promptus ➜