
CogVideoX-Fun ist ein leistungsstarkes KI-Modell, das statische Bilder in kurze Videos mit einer Länge von etwa 6 Sekunden bei 8 FPS umwandelt und bis zu 49 Bilder generiert.
Verwandeln Sie Ihre statischen Bilder in dynamische 6-Sekunden-Videos mit CogVideoX-Fun, einem innovativen KI-Tool, das flüssige, realistische Videoinhalte aus einzelnen Fotos erstellt. Dieses ComfyUI Image to Video Workflow-Tutorial: AI Latest: Convert Images to Videos with CogVideoX-Fun führt Sie durch den gesamten Prozess, auch wenn Sie nur über begrenzte VRAM-Ressourcen verfügen.
Was ist CogVideoX-Fun
CogVideoX-Fun ist ein leistungsstarkes KI-Modell, das statische Bilder in kurze Videos mit einer Länge von etwa 6 Sekunden bei 8 FPS umwandelt und bis zu 49 Bilder generiert. Sie können zwar benutzerdefinierte Modelle für verschiedene Stile trainieren, dieses Tutorial konzentriert sich jedoch auf den grundlegenden Prozess der Konvertierung von Bildern in Videos.
Einrichtung Ihrer ComfyUI-Umgebung
Bereite zuerst deinen ComfyUI Workspace vor:
- Öffne ComfyUI und navigiere zum Manager
- Gehe zum benutzerdefinierten Node Manager
- CogVideo laden (Update falls schon installiert)
Laden wichtiger Komponenten
Beginnen Sie mit der Einrichtung der Kernelemente:
- Laden Sie CLIP und wählen Sie den Google T5-XL FP8-Text-Encoder
- Stellen Sie den Typ auf T3 ein (Download-Link in den Ressourcen verfügbar)
- Verwenden Sie den CogVideo-Text-Encoder zweimal: einmal für positive Eingabeaufforderungen, einmal für negative
Image-Vorbereitungsprozess
Laden Sie Ihr Zielbild und ändern Sie die Größe:
- Importiere dein ausgewähltes Bild
- Öffnen Sie das Bildgrößenänderungs-Tool und stellen Sie eine Verbindung her, um das Bild zu laden
- Stellen Sie die Breite auf 720 und die Höhe auf 480 ein (Standardauflösung des Modells)
- Höhere Auflösungen können zu verschwommener, verrauschter Ausgabe führen
- Konfigurieren Sie die Upscale-Methode als nächstgelegene
- Setze „Proportion beibehalten“ auf „Falsch“
- Aktiviere die Division durch zwei
- Crop-Funktion deaktivieren
Konfiguration des CogVideo-Modells
Richten Sie die wichtigsten Verarbeitungskomponenten ein:
- Laden Sie den CogVideo Loader und wählen Sie CogVideoX-Fun 5B
- FP8 Transformer aktivieren (wichtig für Systeme mit 8GB-12GB VRAM)
- Verwenden Sie den CogVideo-Sampler mit 6 Schritten und CFG-Einstellung
- DPM-Scheduler anwenden
Decoder- und Ausgabeeinstellungen
Konfigurieren Sie die letzte Verarbeitungsphase:
- Öffnen Sie den CogVideo-Decoder
- Stellen Sie die Höhe und Breite des Kachelsamplers auf 96 ein
- Konfigurieren Sie den Kachelüberlappungsfaktor für beide Dimensionen auf 0,083
- Aktiviere VAE-Slicing für glattere Ergebnisse
- Öffnen Sie das Videokombinationstool und überprüfen Sie die Formateinstellungen
Den Workflow verbinden
Verbinde alle Komponenten richtig:
- Verbinden Sie die CogVideo-Pipeline mit dem Sampler
- Positive Eingabeaufforderungsknoten verknüpfen
- Stellen Sie sicher, dass der Sampler mit dem Videodecoder verbunden ist
- Wählen Sie Startbildeingabe
- Verbinden Sie den Endausgang mit dem Videokombinat
Effektive Eingabeaufforderungen erstellen
Erstellen Sie überzeugende Beschreibungen für bessere Ergebnisse:
- Beispiel für eine positive Aufforderung: „Feuerwerk über einer Nachtstadt“
- Negative Aufforderung: „schlechte Qualität, Wasserzeichen auf jedem Bild, seltsame Bewegung“
- Geben Sie die gewünschten Bewegungen und Effekte genau an
Tests und Ergebnisse
Der abgeschlossene Workflow generiert flüssige, realistische Videos mit natürlicher Bewegung. Zu den Beispielen gehören:
- Feuerwerk am Nachthimmel mit realistischen Farben und Bewegungen
- Regen fällt auf Dschungelstraßen mit detaillierten Wassereffekten
- Natürliche Umweltdynamik, die das Originalbild verbessert
Steigern Sie die KI-Nutzung Ihres Teams — arbeiten Sie mit Promptus zusammen. Sei ein Creator auf https://www.promptus.ai
%20(2).avif)
%20transparent.avif)


