WAN 2.5 in Promptus — Anleitung Schritt für Schritt

Generieren Sie Bild-zu-Video, Text-zu-Video und Bild-zu-Video mit Wan 2.5

Warum sich der Einsatz von WAN 2.5 lohnt

Alibaba WAN 2.5 ist ein hochmodernes Modell zur Generierung von Text/Bild zu Video, das auf der DashScope-Plattform von Alibaba Cloud verfügbar ist. Dieses leistungsstarke Modell produziert hochwertige Videos in 480p-, 720p- oder 1080p-Auflösung, komplett mit synchronisiertem Audio, aus einfachen Text- oder Bildanweisungen.

🔊 Native Audio- und Videosynchronisierung

WAN 2.5 generiert nicht nur Bilder, sondern auch Stimmen, Atmosphäre und Musik, die perfekt mit den Lippenbewegungen und dem Szenen-Timing synchronisiert sind. Kein manuelles Ausrichten von Soundtracks oder Lippensynchronisation mehr!

🎛 Multimodale Steuerung (Text, Bild, Audio)

Du kannst es mit einfachem Text anleiten, ein Referenzbild einspeisen und sogar eine Audiospur hinzufügen (wie eine Stimme oder einen Musikclip). Auf diese Weise haben Sie eine viel bessere Kontrolle über den Stil und das Gefühl Ihres endgültigen Videos.

🎥 Hochwertige Ausgabe

unterstützt 480p, 720p und 1080p bei 24 Bildern pro Sekunde. Bei kurzen Clips sieht die synchronisierte Audiokombination mit 1080p+ bereits ausgereift genug aus, um sie für Marketing, soziale Medien oder Demo-Reels zu verwenden.

‍

💸 Kostengünstig im Vergleich zu Mitbewerbern

Es wurde als leichter und erschwinglicher beschrieben als andere High-End-Videomodelle (wie Veo 3) und bietet dennoch synchronisierte Audio- und Bildwiedergabe.

🌍 Bessere mehrsprachige Unterstützung

WAN 2.5 funktioniert besonders gut, wenn Eingabeaufforderungen geschrieben werden Chinesisch oder andere nicht-englische Sprachen — mit sanfterer Lippensynchronisation und stärkerer audiovisueller Ausrichtung.

🌀 Stabile Bewegung und kohärente Szenen

Kameraschwenks, Übergänge und sich bewegende Motive sehen viel flüssiger aus. Die Szenen halten zusammen, ohne das seltsame Flackern oder die „Störungen“, die bei älteren Modellen manchmal auftraten.

Um Wan 2.5 in Promptus zu verwenden

1. Stellen Sie sicher, dass Promptus aktualisiert ist

Promptus bündelt ComfyUI-Workflows, also aktualisieren Sie Promptus einfach auf die neueste Version. Die neue WAN 2.5-API-Knoten erscheint in der Knotensuche.

2. Holen Sie sich Ihren API-Schlüssel

Loggen Sie sich ein bei Alibaba DashScope//Modellstudio und kopiere dein persönliches API-Schlüssel. Sie benötigen dies, um WAN 2.5 auszuführen.

3. Laden Sie den Starter-Workflow

Öffnen Sie Promptus.
Klicken Sie Arbeitsablauf laden und importiere eine der JSON-Dateien, die wir geteilt haben:
- Text zu Video
- Bild-zu-Video
- Text zu Bild
Der Workflow wird im integrierten ComfyUI-Editor von Promptus geöffnet.

4. Konfigurieren Sie den WAN-Knoten

Stellen Sie im WAN-Knoten Folgendes ein:

API-Schlüssel → füge deinen DashScope-Schlüssel ein.
Modell → wan2.5-t2v-Vorschau (Text→Video), wan2.5-i2v-Vorschau (Bild→Video), oder wan2.5-t2i-Vorschau (Text→Bild).
Dauer → 5s oder 10s.
Auflösung → bis zu 1080p, 24fps.
Audio → wählen automatisch generiert, keine, oder Referenz-Audio.
Prompt → gib deine Szenenbeschreibung auf Englisch oder Chinesisch ein.

Wan 2.5 kann Videos generieren, die bis zu 10 Minuten lang sind. Weitere Beispiele finden Sie hier Wan 2.5-Videofunktionen.

5. Führen Sie es in Promptus aus

Klicken Sie Workflow ausführen.
Ihr Video/Bild wird direkt in Promptus gerendert.
Die Ausgaben werden im Promptus ComfyUI Output-Ordner gespeichert. Sie können eine Vorschau anzeigen oder die Dateien herunterladen.

6. Teile mit deinen Freunden

Sie können Ihre Eingabeaufforderungen speichern als Voreinstellungen in Promptus.
Freunde können denselben Workflow öffnen, ihren API-Schlüssel einfügen und ihn ohne zusätzliche Einrichtung ausführen.

Häufig gestellte Fragen

Kann ich ein vorhandenes stummes Video animieren?

Ja. Video-zu-Video überträgt Lippensynchronisation und Gesichtsausdrücke auf einen stummen Clip, während Identität und Szenenkontext erhalten bleiben.

Was ist die maximale Dauer?

Bis zu 10 Minuten pro Generierung.

Wie gut werden mehrere Sprachen und Dialekte unterstützt?

Mehrere Sprachen und verschiedene Dialekte werden unterstützt und können innerhalb eines Clips kombiniert werden. Hinweis: Ein sehr schneller Wechsel innerhalb desselben Clips kann die Stabilität der Synchronisation verringern.

Unterstützt ihr das Hochladen von Audio?

Ja. Wan 2.5 unterstützt das Hochladen einer Sprachspur, um Lippensynchronisation und Timing zu steuern.

Wie verwende ich Wan 2.5 in ComfyUI?

Um Wan 2.5 in ComfyUI zu verwenden, lade den Wan-2.5-Custom-Node aus der Modellbibliothek, verbinde deine Audiospur und dein Video-Input und führe dann den Workflow aus. Du kannst die Präzision der Lippensynchronisation, das Timing und die Ausdruckssteuerung direkt im ComfyUI-Workflow-Editor anpassen.

Geschrieben von:

Duni

Duni ist Ingenieur für künstliche Intelligenz bei Promptus und hat sich auf KI-Workflow-Design spezialisiert. Duni erstellt und dokumentiert ComfyUI-Workflows, die Entwicklern neue Möglichkeiten bieten.

Testen Sie Promptus Cosy UI noch heute kostenlos.

Most recent wikis

Dreamactor m2.0 KI-Bewegungssteuerungsmodell

Claudia Perez

Neuigkeiten

Erstelle einfach deinen nächsten KI-Workflow mit Promptus

Go from idea to production-ready output in minutes.

Promptus kostenlos testen ➜