
Hunyuan Video 1.5 est l'un des meilleurs modèles de génération vidéo open source
Hunyuan Video 1.5 est le modèle révolutionnaire de génération vidéo à 8,3 milliards de paramètres de Tencent, conçu pour fournir des résultats texte-vidéo et image-vidéo de haute qualité, tout en fonctionnant sur des GPU grand public.
Sa disponibilité en open source a également permis la mise en place d'un certain nombre de variantes communautaires, telles que (coût) Hunyuan 1,5 famille, y compris les constructions GGUF qui fonctionnent avec aussi peu que 8 GO DE VRAMet des configurations optimisées pour la 5G pour une inférence extrêmement rapide.
Explication des variantes de Hunyuan Video 1.5 Cosyflow
Dirigé par la communauté douillette publie le repackage Hunyuan Video 1.5 pour une variété de matériels et de cas d'utilisation. Ces versions ne sont pas des versions officielles de Tencent, mais des fonctionnalités communautaires.
(cosy) Hunyuan 1.5 Texte vers vidéo
- Création de la communauté par défaut.
- Meilleure qualité, précision totale pour le modèle 8.3B.
- Recommandé pour 16 À 24 GO DE MÉMOIRE VIVE GPU.
- Même comportement et même qualité de sortie que l'implémentation de référence complète.
(cosy) Hunyuan 1.5 Texte vers vidéo (GGUF)
- Version quantifiée GGUF (similaire aux formats de quantification LLM).
- Empreinte RAM/VRAM beaucoup plus petite.
- Idéal pour les utilisateurs 8 À 12 GO DE MÉMOIRE VIVE GPU.
- Légère réduction de la qualité, mais considérablement plus rapide et plus légère.
(cosy) Hunyuan 1.5 Texte vers vidéo (version GGUF de 8 Go de VRAM)
- Spécialement optimisé pour GPU NVIDIA de 8 Go (par exemple, RTX 3070, 4060).
- Utilise une quantification agressive.
- Compromis :
- Faible fidélité aux mouvements
- Quelques artefacts liés au mouvement de la caméra à haute vitesse
- Des visuels légèrement plus doux
Toujours remarquablement bon pour ses exigences matérielles.
(cosy) Hunyuan 1.5 Texte vers vidéo (5G)
- « 5G » signifie Cible de 5 gigaoctets de VRAM.
- Ultraléger, optimisé de manière agressive.
- Utile pour :
- GPU pour ordinateurs portables
- Instances cloud de niveau gratuit
- Mini-PC au format compact
- La perte de qualité est perceptible, mais elle reste fonctionnelle pour les aperçus de concepts ou les itérations rapides.
Pourquoi les gens qualifient ces vidéos de Hunyuan de « non censurées »
La sortie officielle de Tencent est régie par des restrictions de contenu standard (similaires à Stable Diffusion 1.5 et 3.0). Les versions du flux de travail suppriment les filtres restrictifs, permettant ainsi une utilisation sans blocage de contenu :
- Aucun point de contrôle des classificateurs de sécurité
- Pas de masquage automatique NSFW
- Pas de désinfection rapide
⚠️ Cela ne modifie pas les pondérations du modèle sous-jacent. Le modèle n'a pas été entraîné sur un contenu explicite, mais accepte désormais n'importe quel invite sans blocage.
Hunyuan Video 1.5 utilise un pipeline de diffusion optimisé en plusieurs étapes :
Liens vers des modèles
encodeurs_textes
modèles_de diffusion
- capteurs de sécurité hunyuan video 1.5_1080p_sr_distillled_fp16.
- capteurs de sécurité hunyuan video 1.5_720p_t2v_fp16.
vae
:open_file_folder: ComfyUI/
├── :open_file_folder: models/
│ ├── :open_file_folder: text_encoders/
│ │ ├── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ │ └── byt5_small_glyphxl_fp16.safetensors
│ ├── :open_file_folder: diffusion_models/
│ │ ├── hunyuanvideo1.5_1080p_sr_distilled_fp16.safetensors
│ │ └── hunyuanvideo1.5_720p_t2v_fp16.safetensors
│ └── :open_file_folder: vae/
│ └── hunyuanvideo15_vae_fp16.safetensors
Modèles de flux de travail
- Transaction de texte en vidéo :
video_hunyuan_video_1.5_720p_t2v.json - De l'image à la vidéo :
video_hunyuan_video_1.5_720p_i2v.json
Si ComfyUI ne trouve pas les nœuds :
- Mettre à jour vers Tous les soirs
- Assurez-vous qu'aucune importation d'extension n'a échoué au démarrage
- Assurez-vous que le modèle existe dans votre version
HunYuanVideo 1.5 est actuellement l'une des le plus accessible, de haute qualité, et open source modèles vidéo disponibles, tandis que ses variantes « confortables » communautaires permettent une utilisation non censurée et des déploiements à faible consommation de VRAM.
Limites auxquelles il faut s'attendre
Bien que puissant, HunyuanVideo 1.5 présente quelques contraintes :
- Les vidéos de plus de 10 secondes perdent en qualité
- Les mouvements rapides peuvent provoquer une instabilité temporelle
- Les détails fins peuvent « fondre » d'un cadre à l'autre
- Les versions GGUF réduisent légèrement la fidélité
- Les interactions complexes entre objets ne sont pas parfaites
%20(2).avif)
%20transparent.avif)

