Vidéo Hunyuan 1.5
Creator: Eden
Hunyuan

Hunyuan Video 1.5 — Modèle open source et non censuré #1

Promptus
5 minutes
Wiki 251
promptus ai video generator

Hunyuan Video 1.5 est l'un des meilleurs modèles de génération vidéo open source

Hunyuan Video 1.5 est le modèle révolutionnaire de génération vidéo à 8,3 milliards de paramètres de Tencent, conçu pour fournir des résultats texte-vidéo et image-vidéo de haute qualité, tout en fonctionnant sur des GPU grand public.

Sa disponibilité en open source a également permis la mise en place d'un certain nombre de variantes communautaires, telles que (coût) Hunyuan 1,5 famille, y compris les constructions GGUF qui fonctionnent avec aussi peu que 8 GO DE VRAMet des configurations optimisées pour la 5G pour une inférence extrêmement rapide.

Feature Description
8.3B Parameters Compact compared to 12–40B video models, yet delivers flagship-level quality
720p Native Output Generates 5–10 second clips with 1080p super-resolution upscaling
Text-to-Video (T2V) Produces cinematic sequences from natural language prompts
Image-to-Video (I2V) Animates still images with motion, physics, and camera control
Multilingual Text Rendering Supports both Chinese and English inside scenes
High Prompt Accuracy Excellent with camera paths, physics, emotions, pacing
Open Source Free, modifiable, and supported by an active community


Explication des variantes de Hunyuan Video 1.5 Cosyflow

Dirigé par la communauté douillette publie le repackage Hunyuan Video 1.5 pour une variété de matériels et de cas d'utilisation. Ces versions ne sont pas des versions officielles de Tencent, mais des fonctionnalités communautaires.

(cosy) Hunyuan 1.5 Texte vers vidéo

  • Création de la communauté par défaut.
  • Meilleure qualité, précision totale pour le modèle 8.3B.
  • Recommandé pour 16 À 24 GO DE MÉMOIRE VIVE GPU.
  • Même comportement et même qualité de sortie que l'implémentation de référence complète.

(cosy) Hunyuan 1.5 Texte vers vidéo (GGUF)

  • Version quantifiée GGUF (similaire aux formats de quantification LLM).
  • Empreinte RAM/VRAM beaucoup plus petite.
  • Idéal pour les utilisateurs 8 À 12 GO DE MÉMOIRE VIVE GPU.
  • Légère réduction de la qualité, mais considérablement plus rapide et plus légère.

(cosy) Hunyuan 1.5 Texte vers vidéo (version GGUF de 8 Go de VRAM)

  • Spécialement optimisé pour GPU NVIDIA de 8 Go (par exemple, RTX 3070, 4060).
  • Utilise une quantification agressive.
  • Compromis :
    • Faible fidélité aux mouvements
    • Quelques artefacts liés au mouvement de la caméra à haute vitesse
    • Des visuels légèrement plus doux

Toujours remarquablement bon pour ses exigences matérielles.

(cosy) Hunyuan 1.5 Texte vers vidéo (5G)

  • « 5G » signifie Cible de 5 gigaoctets de VRAM.
  • Ultraléger, optimisé de manière agressive.
  • Utile pour :
    • GPU pour ordinateurs portables
    • Instances cloud de niveau gratuit
    • Mini-PC au format compact
  • La perte de qualité est perceptible, mais elle reste fonctionnelle pour les aperçus de concepts ou les itérations rapides.

Pourquoi les gens qualifient ces vidéos de Hunyuan de « non censurées »

La sortie officielle de Tencent est régie par des restrictions de contenu standard (similaires à Stable Diffusion 1.5 et 3.0). Les versions du flux de travail suppriment les filtres restrictifs, permettant ainsi une utilisation sans blocage de contenu :

  • Aucun point de contrôle des classificateurs de sécurité
  • Pas de masquage automatique NSFW
  • Pas de désinfection rapide

⚠️ Cela ne modifie pas les pondérations du modèle sous-jacent. Le modèle n'a pas été entraîné sur un contenu explicite, mais accepte désormais n'importe quel invite sans blocage.

Hunyuan Video 1.5 utilise un pipeline de diffusion optimisé en plusieurs étapes :

Liens vers des modèles

encodeurs_textes

modèles_de diffusion

vae

:open_file_folder: ComfyUI/
├── :open_file_folder: models/
│   ├── :open_file_folder: text_encoders/
│   │      ├── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   │      └── byt5_small_glyphxl_fp16.safetensors
│   ├── :open_file_folder: diffusion_models/
│   │      ├── hunyuanvideo1.5_1080p_sr_distilled_fp16.safetensors
│   │      └── hunyuanvideo1.5_720p_t2v_fp16.safetensors
│   └── :open_file_folder: vae/
│          └── hunyuanvideo15_vae_fp16.safetensors

Modèles de flux de travail

Si ComfyUI ne trouve pas les nœuds :

  • Mettre à jour vers Tous les soirs
  • Assurez-vous qu'aucune importation d'extension n'a échoué au démarrage
  • Assurez-vous que le modèle existe dans votre version

HunYuanVideo 1.5 est actuellement l'une des le plus accessible, de haute qualité, et open source modèles vidéo disponibles, tandis que ses variantes « confortables » communautaires permettent une utilisation non censurée et des déploiements à faible consommation de VRAM.

Limites auxquelles il faut s'attendre

Bien que puissant, HunyuanVideo 1.5 présente quelques contraintes :

  • Les vidéos de plus de 10 secondes perdent en qualité
  • Les mouvements rapides peuvent provoquer une instabilité temporelle
  • Les détails fins peuvent « fondre » d'un cadre à l'autre
  • Les versions GGUF réduisent légèrement la fidélité
  • Les interactions complexes entre objets ne sont pas parfaites

Recommended

GPU VRAM Expected Performance
RTX 4090 24GB Full precision, fastest generation
RTX 3090 / 4080 16–24GB Produces full-quality results

Minimum (GGUF builds)

GPU VRAM Notes
RTX 4060 / 3070 8GB Works with GGUF 8GB version
Laptop GPUs 6GB 5G build only

Foire Aux Questions

Qu’est-ce que HunyuanVideo 1.5 et comment se compare-t-il aux autres modèles d’IA texte-vers-vidéo ?

+

HunyuanVideo 1.5 est le modèle de diffusion vidéo open source de Tencent, doté de 8,3 milliards de paramètres et conçu pour la génération texte-vers-vidéo et image-vers-vidéo. Comparé à des modèles plus grands (12–40B), il offre une qualité cinématographique similaire tout en fonctionnant efficacement sur des GPU grand public, ce qui en fait l’un des modèles T2V de haute qualité les plus accessibles.

Comment installer et exécuter HunyuanVideo 1.5 sur ComfyUI avec un GPU grand public ?

+

HunyuanVideo 1.5 peut être installé en plaçant ses encodeurs de texte, modèles de diffusion et fichiers VAE dans le dossier models/ de ComfyUI. En utilisant les modèles de workflow fournis (T2V ou I2V), les créateurs peuvent générer des vidéos en 720p ou 1080p sur des GPU de 8 à 24 Go de VRAM. Mettre à jour ComfyUI vers la version Nightly garantit une compatibilité complète.

Quelles sont les différences entre les variantes (cosy) de HunyuanVideo 1.5, y compris les versions GGUF et 5G ?

+

Les variantes cosy offrent différents niveaux de performances : les versions GGUF fonctionnent sur 8–12 Go de VRAM grâce à la quantification, la version 5G fonctionne avec seulement 5 Go de VRAM pour les ordinateurs portables et les offres cloud gratuites, et le modèle complet offre une fidélité maximale pour les GPU de 16–24 Go. Ces versions communautaires améliorent la compatibilité sans modifier le modèle de base.

HunyuanVideo 1.5 est-il non censuré, et qu’est-ce que les versions communautaires retirent ou modifient ?

+

Alors que la version officielle de Tencent inclut des restrictions de contenu telles que des filtres de sécurité, les versions communautaires cosy retirent le blocage de prompts, les filtres NSFW et les classifieurs de sécurité. Les poids du modèle restent inchangés — ce qui signifie que le modèle n’est pas entraîné sur du contenu explicite, mais ne bloque plus les prompts.

Quel matériel est nécessaire pour générer des vidéos avec HunyuanVideo 1.5 sur un GPU à faible VRAM ?

+

HunyuanVideo 1.5 peut fonctionner sur des GPU disposant de seulement 6 à 8 Go de VRAM en utilisant les versions GGUF ou 5G cosy. Pour une qualité optimale, des GPU de 16–24 Go comme les RTX 3090, 4080 ou 4090 sont recommandés. Ces variantes rendent la génération T2V accessible sur des ordinateurs portables et des systèmes économiques.

Créez simplement votre prochaine vidéo IA avec Promptus
Commencez à utiliser Promptus ➜