wan 2.2
Duni
Wan

Wan 2.2 in Promptus mit ComfyUI

Promptus
March 12, 2026
Wiki 190
promptus ai video generator

Eine praktische Anleitung zu Wan 2.2 in Promptus mit ComfyUI — mit Text-, Bild- und Videoeingängen, Parameter-Cheatsheets, Onboarding-Tipps und praktischen FAQs, damit Sie professionelle KI-Videos schneller erstellen können.

CosyFlows sind kuratierte ComfyUI-Workflows, die die Klempner verstecken, aber die kreative Kontrolle behalten. Unter der Haube Wan 2.2 ist ein latentes Videodiffusionssystem: es (1) komprimiert Frames in einen latenten Raum, (2) dekodiert im Laufe der Zeit mit einem räumlich-zeitlichen U-Net, das von Ihren Eingabeaufforderungen /Frames geleitet wird, dann (3) dekodiert es in Video und optional Nachbearbeitung (Debanding, leichtes Schärfen, Framepacing).

Zwei sofort einsatzbereite Abläufe:

  • (gemütlich) Wan 2.2 5B Videogenerierungschnelle Iteration, tolle Details bei 720p (und Entwurf 1080p). Geeignet für Ideenfindung, soziale Netzwerke, Reels und Marketing-Snippets.
  • (gemütlich) Wan 2.2 14B First—Last Frame to Videomaximale Wiedergabetreue beim 1080p, optimiert für keyframe-gesteuert Geschichtenerzählen (fließende Übergänge zwischen zwei entworfenen Bildern).

Promptus hostet die Berechnung, sodass Sie keine Knoten oder Modelle installieren. Sie konzentrieren sich auf Eingabeaufforderungen, Referenzen und einige wichtige Regler.

Drei kreative Modi

1. Text → Video

5B, schnelle Ideenfindung; 14B über Keyframe-Eingabeaufforderungen, wenn Sie Frames angeben

Eingabe: Eine beschreibende Aufforderung (optional eine negative Aufforderung).
Mechanik: Das Modell synthetisiert eine zeitlich konsistente Szene. Deine Worte steuern Inhalt, Kamera, Stimmung, und Antrag.
Tastenbedienelemente zum Wählen:

  • Dauer (en): Kürzer = schärfere Bewegung und weniger Artefakte (z. B. 3—6 s).
  • FPS: 24—30 für natürliche Bewegung; höher = glatter, aber teurer.
  • CFG//Beratung: Höher = näher an der Eingabeaufforderung bleiben; zu hoch kann dazu führen, dass seltsame Details übersättigt werden oder „gesperrt“ werden. Starte ~5—7.
  • Schritte//Sampler: Mehr Schritte = mehr Details/Kohärenz (abnehmende Renditen über einen Punkt hinaus).
  • Saatgut: Sperren Sie es, um vergleichbare Variationen zu erstellen; ändern Sie es, um es zu erkunden.

Schnelle Formel (funktioniert super):
[Betreff] + [Aktion/Bewegung] + [Kamera] + [Beleuchtung] + [Stil/Mittel] + [Ära/Linse] + [Farbe/Grad] + [Stimmung/Adjektive] + Qualitätsmerkmale (z. B. Filmkörnung, hohe Detailgenauigkeit) + NEGATIV: [unerwünschtes Zeug]

Beispiel:
„Golden Retriever plätschert durch einen flachen See, Handheld mittlerer Schuss, Sonnenuntergang mit Hintergrundbeleuchtung, filmische Farbqualität, sanft Bokeh, natürliche Filmkörnung, warme Töne — NEGATIV: Textüberlagerungen, Wasserzeichen, Bewegungsunschärfe, doppelte Gesichter“

2. Bild → Video

5B am besten; 14B, wenn Sie das Standbild als „erstes Bild“ behandeln

Eingabe: Ein Referenzbild (Stil/Thema).
Mechanik: Das Bild verankert Struktur und Stil; Diffusion erfindet eine plausible Bewegung um es herum.
Tastenbedienelemente zum Wählen:

  • Einheitenstärke//Rauschunterdrückungsstärke (oft „Stärke“ genannt):
    • Niedriger (~0,3—0,45) = Bewahren Sie mehr von Ihrem Bild auf (sanfte Parallaxe, Atmung, kleine Kamerabewegungen).
    • Höher (~0,5—0,65) = neue Inhalte/Bewegung zulassen; Gefahr, vom Stil abzudriften.
  • Bewegungsvoreinstellungen (falls verfügbar) oder einfache Aufforderungsverben: „slow dolly-in“, „subtle breeze“, „light camera sway“.
  • Dauer/FPS wie oben.

Tipp: Fügen Sie ein Beschreibung der Bewegung („Weicher Wind bewegt Gras; Kameradolly links 10%“), sodass das Modell für glaubwürdige Dynamik sorgt, anstatt große Aktionen zu halluzinieren.

3. Video → Video

5B für Geschwindigkeit; 14B für hochwertigen Feinschliff mit zwei Keyframes oder kurzen Blöcken

Eingabe: Ein Quellclip (Live-Action, 3D-Rendering oder einfacher Entwurf).
Mechanik: Das Modell stilisiert oder ändert die Eingabe unter Beibehaltung der Kernbewegung.
Tastenbedienelemente zum Wählen:

  • Stärke von Denoise:
    • 0,35—0,5 = Struktur/Bewegung beibehalten, Stil hinzufügen (am besten für Markenkonsistenz).
    • 0,5—0,65 = größere Umgestaltungen zulassen (Kostentreue zum Original).
  • Stilaufforderung: Seien Sie explizit darüber Mittel (Zellanimation, Ölfarbe, Fotoreal), Klasse, Linse, Zeitalter.
  • Negative Aufforderung: „kein Text, keine zusätzlichen Logos, keine starke Unschärfe, kein Jitter“.
  • Anpassung der Bildrate: Wenn Sie Ihre Quell-FPS anpassen, wird der Jitter reduziert.

Profi-Move: Füttere einen sauber, kontrastreich Quelle mit gleichbleibender Exposition. Müll rein = flackern raus.

14B Erste—Letztes Bild

Dieser Fluss leuchtet, wenn du Laden Sie zwei kunstorientierte Frames hoch (zuerst und zuletzt) und beschreibe die Übergang:

  • Rahmen: 1920×1080 PNG/JPG mit gleichbleibende Note (Weißabgleich, Kontrast).
  • Aufforderung zur Umstellung: Beschreiben was sich im Laufe der Zeit ändert (Beleuchtung, Wetter, Pose, Kamerapfad).
  • Bildrate: 24 Bilder pro Sekunde sind eine hervorragende Grundlage für filmisches Tempo.
  • Dauer: Sequenzen von 3—8 Sekunden sehen in der Regel am „hochwertigsten“ und kohärentesten aus.

Kurzes Beispiel:
Erstes Bild: „Wald in der Morgendämmerung“ → Letztes Bild: „Derselbe Wald in der Abenddämmerung“
Aufforderung: „Die Sonne geht auf, dann wird es warm zur goldenen Stunde; langsam hochdrehen, Blätter rascheln leicht; filmisch“

Effektiver Parameter-Spickzettel

  • Prompt/Negative Aufforderung → semantische Lenkung und Leitplanken.
  • Saatgut → Wiederholbarkeit; Sperre, um Anpassungen von Äpfeln zu Äpfeln zu vergleichen.
  • CFG (Leitskala) → schnelle Einhaltung versus Freiheit (Start 5—7).
  • Schritte → Detail/Kohärenz (in der Mitte beginnen; bei matschigen Bildern höher gehen).
  • Stärke (init/denoise) → wie stark vom Eingabebild/Video abweichen soll.
  • Dauer und FPS → Gesamtzahl der Bilder; wirkt sich auf Bewegungsglätte und Artefaktrisiko aus.
  • Auflösung → 720p für Entwürfe; 1080p für Finals (insb. 14B).
  • Bewegungs- und Kamerahinweise → Dolly, Pan, Tilt, Zoom, Parallaxe — kleine Zahlen fühlen sich echt an.

Bewährte Rezepte

  • Schneller Entwurf, hochwertige Verarbeitung:
    5B @ 720p (kurze Clips) → Eingabeaufforderungen wiederholen → Geschwindigkeit sperren → 14B @ 1080p mit enger Übergangsbeschreibung (bei Verwendung von Keyframes).
  • Zusammenhängender Markenstil (Video→Video):
    Behalten Denoise ~0,4—0,5, starke Stilaufforderung („sauberes kommerzielles Aussehen, leises Tastenlicht, neutraler Hintergrund“) und negativ („keine zusätzlichen Logos, keine Vignette“).
  • Bild-→Video-Parallaxenschleife:
    Ein Held immer noch + fordert „subtiles Eindrücken der Kamera, geringe Schärfentiefe, sanfte Haarbewegung“ —Stärke ~0,4 zur Wahrung der Identität.

Problembehebung

  • Flicker/ „Texturschwimmen“: Verkürzen Sie die Dauer; erhöhen Sie die Schritte leicht; fügen Sie dem Negativ „stabile Texturen, kein Flackern“ hinzu; reduzieren Sie die Stärke.
  • Gesichter/Hände driften: Aufforderung festziehen („Einzelobjekt, Gesichtsgeometrie reinigen“), Kraft reduzieren, Stufen erhöhen; mit einem neuen Saatgut probieren.
  • Bewegung zu wild: Verringern Sie die Stärke; fügen Sie explizite „langsame“ Kamera-/Aktionsverben hinzu; verringern Sie FPS oder Dauer.
  • Verschwommene Bilder: Erhöhen Sie die Schritte etwas; probieren Sie einen anderen Sampler aus; stellen Sie für das Finale 1080p auf 14B sicher.
  • Farb-/Belichtungs-Popps (erste—letzte): Passen Sie die Abstufungen zwischen den Keyframes an; beschreiben Sie die Lichtentwicklung klar und deutlich.

Checkliste für den Schnellstart

  1. Ablauf auswählen: 5B für Entwürfe/14B für Finals mit Keyframes.
  2. Schreiben Sie die Aufforderung: Motiv + Aktion + Kamera + Beleuchtung + Stil + Negativ.
  3. Legen Sie die Grundlagen fest: 720p/1080p, Dauer, Bilder pro Sekunde, Schritte ~Mitte, CFG ~5—7, Taktgeschwindigkeit.
  4. (Bild-/Videoeingänge?) Set Stärke ~0,4—0,55 je nachdem, wie viel Veränderung du willst.
  5. Generieren → Bewertung: Wenn Sie nicht im Stil sind, verringern Sie die Stärke oder fügen Sie weitere Stilwörter hinzu. Wenn Sie nicht zur Eingabe aufgefordert werden, erhöhen Sie den CFG-Wert leicht.
  6. Finalisieren: Führen Sie Best Take bei 1080p (14B) mit passenden Noten und einer expliziten Übergangsbeschreibung erneut aus.

Wann soll ich welche wählen

  • 5B Text → Video: Ideenfindung, soziale Kürzungen, schnelle A/B-Aufforderungen, Storyboarding.
  • 5B Bild → Video: Fotografische Parallaxe „lebende Standbilder“, sanfte Bewegungslogos/Packshots.
  • 5B-Video→Video: Konsistente Stilisierung von aufgezeichnetem Filmmaterial oder CG-Playblasts.
  • 14B Erst-Letzter: Heldenübergänge, Markenenthüllungssequenzen, filmische Mikrogeschichten.

Wan 2.2 in Promptus ComfyUI – FAQ

Was ist Wan 2.2 in Promptus mit ComfyUI?

+

Wan 2.2 ist ein professionelles latentes Video-Diffusionsmodell, das in Promptus als CosyFlows angeboten wird. Es verpackt kuratierte ComfyUI-Node-Graphs in einen No-Code-Cloud-Workflow, sodass Creators Videos aus Text, Bildern oder Videos erzeugen können, ohne Nodes oder Modelldateien installieren zu müssen. Alles läuft auf Cloud-GPUs mit einfachen, ComfyUI-ähnlichen Steuerungen.

Wie entscheide ich mich zwischen Wan 2.2 5B und Wan 2.2 14B in Promptus für Text-zu-Video und Keyframe-Animation?

+

Wähle 5B für schnelle Entwürfe und Social-Clips (ideal für Text→Video und Bild→Video in 720p; manche Setups können auch 1080p entwerfen). Wähle 14B für finale 1080p-Qualität und keyframe-gesteuerte Sequenzen (erstes→letztes Bild). Ein typischer Workflow ist: Mit 5B entwerfen, mit 14B finalisieren.

Was sind die besten Prompt-Strategien für Wan 2.2 Text-zu-Video in Promptus (Kamera, Licht, Stil, negative Prompts)?

+

Verwende einen strukturierten Prompt: Motiv + Aktion + Kamera + Licht + Stil/Medium + Linse/Epoche + Color Grading + Stimmung; ergänze negative Begriffe, um Artefakte zu blockieren. Beispiel: „Küstenleuchtturm zur blauen Stunde, langsame Kamerafahrt nach vorn, weicher Nebel, cineastisches Grading, 35mm-Look — NEGATIVE: Text-Overlay, Logos, starke Unschärfe.“

Wie funktioniert Bild-zu-Video mit Wan 2.2 in ComfyUI und welchen Strength-/Denoise-Wert sollte ich verwenden?

+

Lade ein Standbild hoch, um Komposition und Stil zu verankern; Wan 2.2 synthetisiert die Bewegung darum herum. Starte mit Strength ~0,35–0,45, um das Bild zu erhalten (Parallaxe, subtiler Push). Erhöhe auf ~0,5–0,65 für mehr kreative Veränderung. Beschreibe die gewünschte Bewegung im Prompt.

Wie führe ich Video-zu-Video-Style-Transfer mit Wan 2.2 in Promptus aus, ohne Bewegungs-Kohärenz oder Markenlook zu verlieren?

+

Importiere einen sauberen Quellclip, setze Denoise/Strength auf ~0,4–0,55, um die Struktur zu erhalten, füge einen präzisen Stil-Prompt hinzu (Medium, Grading, Linse) sowie einen negativen Prompt, um Artefakte zu vermeiden. Passe die FPS an die Quelle an, um Stabilität zu wahren, und bevorzuge kürzere Dauer für sauberere Ergebnisse.

Welche Einstellungen liefern die saubersten Ergebnisse in Wan 2.2 (Dauer, FPS, Guidance/CFG, Steps, Seed, 720p vs. 1080p)?

+

Ziele auf 3–8 Sekunden Dauer, 24–30 fps, CFG 5–7 und erhöhe die Steps, wenn Frames weich wirken. Sperre den Seed beim Iterieren für konsistente Vergleiche. Entwirf in 720p mit 5B; finalisiere in 1080p mit 14B.

Wie nutze ich Wan 2.2 14B First–Last Frame, um cineastische 1080p-Übergänge in Promptus zu erstellen?

+

Lade zwei bearbeitete Frames hoch (z. B. 1920×1080), beschreibe den Übergang im Zeitverlauf (Licht, Wetter, Kamerapfad), wähle etwa 24 fps und eine kompakte Dauer von 3–8 Sekunden und rendere dann. Übereinstimmende Farben und Kontraste zwischen den Frames sind entscheidend.

Was sind häufige Artefakte in Wan 2.2 (Flackern, Unschärfe, Face Drift) und wie behebe ich sie im Promptus-Workflow-Panel?

+

Bei Flackern: Dauer verkürzen, „no flicker“ zu den Negatives hinzufügen, Steps erhöhen, Strength senken. Bei Unschärfe: Steps erhöhen oder einen anderen Sampler probieren und in 1080p mit 14B finalisieren. Bei Face-/Hand-Drift: Strength reduzieren, Identitätsdetails ergänzen, einen neuen Seed testen und Aufnahmen kürzer halten.

Kann ich schnell in 720p mit Wan 2.2 5B iterieren und dann auf 1080p mit 14B hochskalieren oder finalisieren – was ist der ideale Workflow?

+

Ja. Iteriere Ideen schnell mit 5B in 720p (Seed sperren, Prompt und Strength verfeinern) und führe dann den besten Take mit 14B in 1080p erneut aus, um ein cineastisches Endergebnis zu erhalten.

Brauche ich eine lokale GPU für Wan 2.2 in Promptus und wie unterscheidet sich Cloud-Rendering vom lokalen Betrieb von ComfyUI?

+

Eine lokale GPU ist nicht erforderlich. Promptus nutzt verteilte Cloud-GPUs für sofortige Ausführung. Lokales ComfyUI bietet vollständige DIY-Kontrolle, erfordert aber VRAM und Wartung; CosyFlows entfernt diesen Setup-Aufwand und behält trotzdem die kreative Kontrolle bei.

Wie halte ich Farbe und Belichtung zwischen erstem und letztem Frame für 14B-Keyframe-Animation in Promptus konsistent?

+

Bearbeite beide Frames vor dem Upload (gleicher Weißabgleich, Kontrast oder LUT). Beschreibe die Entwicklung des Lichts im Prompt und vermeide radikal unterschiedliche Gradings, sofern diese Veränderung nicht beabsichtigt ist.

Welche Dateiformate, Seitenverhältnisse und Bildraten unterstützt Wan 2.2 in Promptus für exportfertige MP4-Videos?

+

Exporte erfolgen als MP4 für einfaches Teilen. Übliche Presets sind 1280×720 (16:9) und 1920×1080 (16:9); weitere Seitenverhältnisse hängen vom jeweiligen CosyFlow ab. Typische Bildraten liegen bei 24–30 fps — richte dich nach den Empfehlungen deiner Zielplattform.

Geschrieben von:
Duni
Duni ist Ingenieur für künstliche Intelligenz bei Promptus und hat sich auf KI-Workflow-Design spezialisiert. Duni erstellt und dokumentiert ComfyUI-Workflows, die Entwicklern neue Möglichkeiten bieten.
Testen Sie Promptus Cosy UI noch heute kostenlos.
Erstelle einfach deinen nächsten KI-Workflow mit Promptus
Go from idea to production-ready output in minutes.
Promptus kostenlos testen ➜