
Hunyuan Video 1.5 es uno de los mejores modelos de generación de vídeo de código abierto
Hunyuan Video 1.5 es el revolucionario modelo de generación de vídeo con 8,3 mil millones de parámetros de Tencent, diseñado para ofrecer resultados de conversión de texto a vídeo e imagen a vídeo de alta calidad, a la vez que se ejecuta en GPU aptas para consumidores.
Su disponibilidad de código abierto también ha permitido una serie de variantes comunitarias, como la (acogedor) Hunyuan 1.5 familia, incluidas las compilaciones de GGUF que funcionan con tan poco como 8 GB DE VRAMy configuraciones optimizadas para 5G para inferencias extremadamente rápidas.
Explicación de las variantes de Cosyflow de Hunyuan Video 1.5
Dirigido por la comunidad acogedor lanza el reempaquetado de Hunyuan Video 1.5 para una variedad de hardware y casos de uso. Estas versiones no son compilaciones oficiales de Tencent, sino que son comodidades para la comunidad.
(cosy) Hunyuan 1.5 Texto a vídeo
- Compilación comunitaria predeterminada.
- La mejor calidad y precisión total para el modelo 8,3B.
- Recomendado para 16 A 24 GB DE VRAM GPUs.
- El mismo comportamiento y calidad de salida que la implementación de referencia completa.
(cosy) Hunyuan 1.5 Texto a vídeo (GGUF)
- Versión cuantificada GGUF (similar a los formatos de cuantificación LLM).
- Tamaño de RAM/VRAM mucho menor.
- Ideal para usuarios con 8 A 12 GB DE VRAM GPUs.
- Ligera reducción de calidad, pero considerablemente más rápida y ligera.
(acogedor) Hunyuan 1.5 de texto a vídeo (versión GGUF de 8 GB de VRAM)
- Optimizado específicamente para GPU NVIDIA de 8 GB (p. ej., RTX 3070, 4060).
- Utiliza una cuantificación agresiva.
- Compensaciones:
- Menor fidelidad de movimiento
- Algunos artefactos en el movimiento de cámara a alta velocidad
- Imágenes un poco más suaves
Sigue siendo notablemente bueno para sus requisitos de hardware.
(cosy) Hunyuan 1.5 Texto a video (5G)
- «5G» significa Objetivo de VRAM de 5 gigabytes.
- Ultraligero, optimizado de forma agresiva.
- Útil para:
- GPU para portátiles
- Instancias de nivel gratuito en la nube
- Mini-PC de formato pequeño
- La pérdida de calidad es notable, pero sigue siendo funcional para previsualizaciones de conceptos o iteraciones rápidas.
Por qué la gente llama a estos videos de Hunyuan «sin censura»
La versión oficial de Tencent se rige por las restricciones de contenido estándar (similares a las de Stable Diffusion 1.5 y 3.0). Las compilaciones del flujo de trabajo eliminan los filtros restrictivos, lo que permite su uso sin bloquear el contenido:
- Sin puntos de control de clasificación de seguridad
- Sin enmascaramiento automático NSFW
- Sin desinfección inmediata
⚠️ Esto no altera las ponderaciones del modelo subyacente. El modelo no ha sido entrenado en contenido explícito, pero ahora acepta ninguna indica sin bloquear.
Hunyuan Video 1.5 utiliza un canal de difusión multietapa optimizado:
Vínculos modelo
codificadores de texto
modelos_de_difusión
jarrón
:open_file_folder: ComfyUI/
├── :open_file_folder: models/
│ ├── :open_file_folder: text_encoders/
│ │ ├── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ │ └── byt5_small_glyphxl_fp16.safetensors
│ ├── :open_file_folder: diffusion_models/
│ │ ├── hunyuanvideo1.5_1080p_sr_distilled_fp16.safetensors
│ │ └── hunyuanvideo1.5_720p_t2v_fp16.safetensors
│ └── :open_file_folder: vae/
│ └── hunyuanvideo15_vae_fp16.safetensors
plantillas de flujo de trabajo
- Texto a vídeo:
video_hunyuan_video_1.5_720p_t2v.json - De imagen a vídeo:
video_hunyuan_video_1.5_720p_i2v.json
Si ComfyUI no puede encontrar los nodos:
- Actualizar a Todas las noches
- Asegúrese de que no haya fallado la importación de extensiones al inicio
- Asegúrese de que la plantilla existe en su versión
HunYuanVideo 1.5 es actualmente uno de los más accesible, de alta calidad, y de código abierto modelos de vídeo disponibles, mientras que sus variantes «acogedoras» para la comunidad permiten el uso sin censura y las implementaciones con poca VRAM.
Limitaciones a esperar
Aunque potente, HunYuanVideo 1.5 tiene algunas limitaciones:
- Los vídeos de más de 10 segundos pierden calidad
- El movimiento rápido puede provocar fluctuaciones temporales
- Los detalles finos pueden «fundirse» en todos los marcos
- Las versiones GGUF reducen ligeramente la fidelidad
- Las interacciones de objetos complejos no son perfectas
%20(2).avif)
%20transparent.avif)

