HunyuanVideo 1.5 est-il non censuré et qu’est-ce que les builds communautaires retirent ou modifient ?

Les versions officielles incluent des filtres de sécurité, mais les versions communautaires cosy retirent le blocage NSFW, les restrictions de prompts et les classifieurs de sécurité. Les poids du modèle restent inchangés, permettant des prompts non restreints.

Hunyuan Video 1.5 — Modèle open source et non censuré #1

Q: Qu’est-ce que HunyuanVideo 1.5 et comment se compare-t-il aux autres modèles d’IA texte-vers-vidéo ?

HunyuanVideo 1.5 est un modèle de diffusion vidéo de 8,3 milliards de paramètres développé par Tencent. Il produit des résultats texte-vers-vidéo et image-vers-vidéo de haute qualité comparables à ceux de modèles plus grands, tout en s’exécutant efficacement sur des GPU grand public.

Q: Comment installer et exécuter HunyuanVideo 1.5 sur ComfyUI avec un GPU grand public ?

Vous pouvez installer HunyuanVideo 1.5 en plaçant ses fichiers modèles dans les dossiers appropriés de ComfyUI et en utilisant les workflows officiels T2V ou I2V. Il fonctionne sur des GPU de 8 à 24 Go, et il est recommandé d’utiliser la version Nightly de ComfyUI pour une compatibilité totale.

Q: Quelles sont les différences entre les variantes (cosy) de HunyuanVideo 1.5, y compris les versions GGUF et 5G ?

Les variantes cosy incluent des versions GGUF pour les GPU de 8–12 Go, une version 5G pour les systèmes disposant de 5 Go de VRAM, et une version complète pour les GPU de 16–24 Go. Ces versions utilisent la quantification afin d’améliorer la compatibilité matérielle sans modifier les poids originaux du modèle.

Q: Quel matériel est nécessaire pour générer des vidéos avec HunyuanVideo 1.5 sur un GPU à faible VRAM ?

Les GPU à faible VRAM tels que les modèles 6 Go ou 8 Go peuvent exécuter HunyuanVideo 1.5 en utilisant les versions GGUF ou 5G cosy. Pour une qualité maximale et une précision complète, des GPU de 16–24 Go comme les RTX 3090, 4080 ou 4090 sont recommandés.

Hunyuan Video 1.5 est l'un des meilleurs modèles de génération vidéo open source

Hunyuan Video 1.5 est le modèle révolutionnaire de génération vidéo à 8,3 milliards de paramètres de Tencent, conçu pour fournir des résultats texte-vidéo et image-vidéo de haute qualité, tout en fonctionnant sur des GPU grand public.

Sa disponibilité en open source a également permis la mise en place d'un certain nombre de variantes communautaires, telles que (coût) Hunyuan 1,5 famille, y compris les constructions GGUF qui fonctionnent avec aussi peu que 8 GO DE VRAMet des configurations optimisées pour la 5G pour une inférence extrêmement rapide.

Feature	Description
8.3B Parameters	Compact compared to 12–40B video models, yet delivers flagship-level quality
720p Native Output	Generates 5–10 second clips with 1080p super-resolution upscaling
Text-to-Video (T2V)	Produces cinematic sequences from natural language prompts
Image-to-Video (I2V)	Animates still images with motion, physics, and camera control
Multilingual Text Rendering	Supports both Chinese and English inside scenes
High Prompt Accuracy	Excellent with camera paths, physics, emotions, pacing
Open Source	Free, modifiable, and supported by an active community

Explication des variantes de Hunyuan Video 1.5 Cosyflow

Dirigé par la communauté douillette publie le repackage Hunyuan Video 1.5 pour une variété de matériels et de cas d'utilisation. Ces versions ne sont pas des versions officielles de Tencent, mais des fonctionnalités communautaires.

(cosy) Hunyuan 1.5 Texte vers vidéo

Création de la communauté par défaut.
Meilleure qualité, précision totale pour le modèle 8.3B.
Recommandé pour 16 À 24 GO DE MÉMOIRE VIVE GPU.
Même comportement et même qualité de sortie que l'implémentation de référence complète.

(cosy) Hunyuan 1.5 Texte vers vidéo (GGUF)

Version quantifiée GGUF (similaire aux formats de quantification LLM).
Empreinte RAM/VRAM beaucoup plus petite.
Idéal pour les utilisateurs 8 À 12 GO DE MÉMOIRE VIVE GPU.
Légère réduction de la qualité, mais considérablement plus rapide et plus légère.

(cosy) Hunyuan 1.5 Texte vers vidéo (version GGUF de 8 Go de VRAM)

Spécialement optimisé pour GPU NVIDIA de 8 Go (par exemple, RTX 3070, 4060).
Utilise une quantification agressive.
Compromis :
- Faible fidélité aux mouvements
- Quelques artefacts liés au mouvement de la caméra à haute vitesse
- Des visuels légèrement plus doux

Toujours remarquablement bon pour ses exigences matérielles.

(cosy) Hunyuan 1.5 Texte vers vidéo (5G)

« 5G » signifie Cible de 5 gigaoctets de VRAM.
Ultraléger, optimisé de manière agressive.
Utile pour :
- GPU pour ordinateurs portables
- Instances cloud de niveau gratuit
- Mini-PC au format compact
La perte de qualité est perceptible, mais elle reste fonctionnelle pour les aperçus de concepts ou les itérations rapides.

Pourquoi les gens qualifient ces vidéos de Hunyuan de « non censurées »

La sortie officielle de Tencent est régie par des restrictions de contenu standard (similaires à Stable Diffusion 1.5 et 3.0). Les versions du flux de travail suppriment les filtres restrictifs, permettant ainsi une utilisation sans blocage de contenu :

Aucun point de contrôle des classificateurs de sécurité
Pas de masquage automatique NSFW
Pas de désinfection rapide

⚠️ Cela ne modifie pas les pondérations du modèle sous-jacent. Le modèle n'a pas été entraîné sur un contenu explicite, mais accepte désormais n'importe quel invite sans blocage.

Hunyuan Video 1.5 utilise un pipeline de diffusion optimisé en plusieurs étapes :

Liens vers des modèles

encodeurs_textes

modèles_de diffusion

vae

capteurs hunyuanvideo15_vae_fp16.safe

:open_file_folder: ComfyUI/
├── :open_file_folder: models/
│   ├── :open_file_folder: text_encoders/
│   │      ├── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   │      └── byt5_small_glyphxl_fp16.safetensors
│   ├── :open_file_folder: diffusion_models/
│   │      ├── hunyuanvideo1.5_1080p_sr_distilled_fp16.safetensors
│   │      └── hunyuanvideo1.5_720p_t2v_fp16.safetensors
│   └── :open_file_folder: vae/
│          └── hunyuanvideo15_vae_fp16.safetensors

Modèles de flux de travail

Transaction de texte en vidéo : video_hunyuan_video_1.5_720p_t2v.json
De l'image à la vidéo : video_hunyuan_video_1.5_720p_i2v.json

Si ComfyUI ne trouve pas les nœuds :

Mettre à jour vers Tous les soirs
Assurez-vous qu'aucune importation d'extension n'a échoué au démarrage
Assurez-vous que le modèle existe dans votre version

HunYuanVideo 1.5 est actuellement l'une des le plus accessible, de haute qualité, et open source modèles vidéo disponibles, tandis que ses variantes « confortables » communautaires permettent une utilisation non censurée et des déploiements à faible consommation de VRAM.

Limites auxquelles il faut s'attendre

Bien que puissant, HunyuanVideo 1.5 présente quelques contraintes :

Les vidéos de plus de 10 secondes perdent en qualité
Les mouvements rapides peuvent provoquer une instabilité temporelle
Les détails fins peuvent « fondre » d'un cadre à l'autre
Les versions GGUF réduisent légèrement la fidélité
Les interactions complexes entre objets ne sont pas parfaites

GPU	VRAM	Expected Performance
RTX 4090	24GB	Full precision, fastest generation
RTX 3090 / 4080	16–24GB	Produces full-quality results

Minimum (GGUF builds)

GPU	VRAM	Notes
RTX 4060 / 3070	8GB	Works with GGUF 8GB version
Laptop GPUs	6GB	5G build only

‍

Foire Aux Questions

Qu’est-ce que HunyuanVideo 1.5 et comment se compare-t-il aux autres modèles d’IA texte-vers-vidéo ?

HunyuanVideo 1.5 est le modèle de diffusion vidéo open source de Tencent, doté de 8,3 milliards de paramètres et conçu pour la génération texte-vers-vidéo et image-vers-vidéo. Comparé à des modèles plus grands (12–40B), il offre une qualité cinématographique similaire tout en fonctionnant efficacement sur des GPU grand public, ce qui en fait l’un des modèles T2V de haute qualité les plus accessibles.

Comment installer et exécuter HunyuanVideo 1.5 sur ComfyUI avec un GPU grand public ?

HunyuanVideo 1.5 peut être installé en plaçant ses encodeurs de texte, modèles de diffusion et fichiers VAE dans le dossier models/ de ComfyUI. En utilisant les modèles de workflow fournis (T2V ou I2V), les créateurs peuvent générer des vidéos en 720p ou 1080p sur des GPU de 8 à 24 Go de VRAM. Mettre à jour ComfyUI vers la version Nightly garantit une compatibilité complète.

Quelles sont les différences entre les variantes (cosy) de HunyuanVideo 1.5, y compris les versions GGUF et 5G ?

Les variantes cosy offrent différents niveaux de performances : les versions GGUF fonctionnent sur 8–12 Go de VRAM grâce à la quantification, la version 5G fonctionne avec seulement 5 Go de VRAM pour les ordinateurs portables et les offres cloud gratuites, et le modèle complet offre une fidélité maximale pour les GPU de 16–24 Go. Ces versions communautaires améliorent la compatibilité sans modifier le modèle de base.

HunyuanVideo 1.5 est-il non censuré, et qu’est-ce que les versions communautaires retirent ou modifient ?

Alors que la version officielle de Tencent inclut des restrictions de contenu telles que des filtres de sécurité, les versions communautaires cosy retirent le blocage de prompts, les filtres NSFW et les classifieurs de sécurité. Les poids du modèle restent inchangés — ce qui signifie que le modèle n’est pas entraîné sur du contenu explicite, mais ne bloque plus les prompts.

Quel matériel est nécessaire pour générer des vidéos avec HunyuanVideo 1.5 sur un GPU à faible VRAM ?

HunyuanVideo 1.5 peut fonctionner sur des GPU disposant de seulement 6 à 8 Go de VRAM en utilisant les versions GGUF ou 5G cosy. Pour une qualité optimale, des GPU de 16–24 Go comme les RTX 3090, 4080 ou 4090 sont recommandés. Ces variantes rendent la génération T2V accessible sur des ordinateurs portables et des systèmes économiques.

Written by:

Eden

Artiste de formation qui craignait autrefois que l'art de l'IA ne mette fin à sa carrière, Eden l'a depuis considérée comme une puissante alliée. Aujourd'hui, elle crée en toute confiance grâce à l'IA, alliant tradition et technologie dans son travail.

Try Promptus Cosy UI today for free.

Most recent wikis

Modèle de contrôle de mouvement dreamactor m2.0 AI

Claudia Perez

Actualités

Créez simplement votre prochaine vidéo IA avec Promptus

Go from idea to production-ready output in minutes.

Commencez à utiliser Promptus ➜