
Die KI-Videoaufforderungsreise durch Anfängerfehler bietet detaillierte Tutorials zur Übersetzung abstrakter Konzepte, zur Lösung widersprüchlicher Anweisungen und zu iterativen Verbesserungsstrategien.
Wie mein erster Versuch, KI-Videos zu generieren, mir mehr über Prompt Engineering beigebracht hat, als es jedes Tutorial könnte.
Als Praktikant bei Promptus bekam ich Veo 3 endlich mit einem ehrgeizigen Ziel in die Hände: eine fotorealistische menschliche Figur zu schaffen, die ausschließlich aus fließenden digitalen Datenströmen besteht. Was ich stattdessen bekam, war eine leuchtend blaue Figur mit unerwarteten Wassergeräuschen — und einige wertvolle Lektionen darüber, wie KI unsere kreativen Anweisungen tatsächlich interpretiert.
Die Vision gegen die Realität
Meine ursprüngliche Aufforderung war unglaublich detailliert — über 200 Wörter, die alles von „fotorealistischer Physik“ bis hin zu „volumetrischen Lichteigenschaften“ abdeckten. Ich dachte wie ein 3D-Künstler und verwendete Fachjargon über Render-Engines und Algorithmen zur Streuung unter der Oberfläche.
Das Ergebnis? Ein durchgehend blauer Humanoid mit Wasserton statt der fließenden digitalen Einheit, die ich mir vorgestellt hatte.
Was schief gelaufen ist (und was ich gelernt habe)
1. Abstrakte Konzepte lassen sich nicht übersetzen
Als ich „digitale Datenströme“ sagte, stellte ich mir Die Matrix vor. Die KI hörte eine „vage leuchtende Textur“ und trug sie auf eine feste Form auf.
2. Widersprüchliche Anweisungen verwirren das Modell
Wenn die KI nach etwas fragt, das sowohl „wie Flüssigkeit fließt“ als auch „die menschliche Silhouette perfekt beibehält“, muss sich die KI entscheiden. Sie hat standardmäßig die sicherere feste Form verwendet.
3. Nicht spezifiziertes Audio = beste Vermutung durch KI
Wörter wie „fließen“ und „Bäche“ ohne Audiorichtung veranlassten die KI, diese mit Wassergeräuschen zu verknüpfen.
4. Fachjargon ist nicht effektiv
KI reagiert besser auf „es leuchtet leise“ als auf „genaue Algorithmen zur Streuung unter der Oberfläche“.
Die Lösung: Drei konkrete Ansätze
Anstelle abstrakter Konzepte habe ich es mit spezifischen visuellen Beschreibungen versucht:
- Eine humanoide Figur aus kaskadierendem blauem und violettem Binärcode
- Eine Figur, die aus Millionen winziger, wirbelnder Lichtteilchen besteht
- Ein Wesen aus reiner fließender Energie, das aus quecksilberähnlichem Plasma besteht
Jede Version gab der KI etwas Konkretes, mit dem sie arbeiten konnte.
Wichtige Erkenntnisse für bessere Prompts
1. Seien Sie visuell spezifisch: Sag „wirbelnde goldene Funken“, nicht „magische Energie“
2. Beschreiben Sie Ergebnisse, keine Methoden: „Partikel prallen auf natürliche Weise ab“ statt „nutze realistische Physik“
3. Immer direktes Audio: Auch wenn es „völlige Stille“ ist
4. Konflikte lösen: Erkläre, wie etwas sowohl fließend ALS auch fest sein kann
Das Lernen geht weiter
Ich arbeite immer noch an der Textintegrationsherausforderung — „Promptus“ soll deutlich in der Brust der Figur erscheinen. Aber das ist das Schöne daran, über Promptus Zugang zu modernsten Tools zu haben: Ich kann experimentieren, scheitern, wiederholen und lernen.
Jede Generation bringt mir etwas Neues darüber bei, wie diese Modelle denken. Die Arbeit bei Promptus bietet mir den perfekten Spielplatz, um Grenzen zu überschreiten und zu teilen, was ich dabei entdecke.
Was ist Ihre größte Herausforderung bei der KI-Generierung? Das Schöne an Tools wie Veo 3 ist, dass jeder „Fehler“ uns etwas Wertvolles über die Technologie lehrt, die wir alle gerade beherrschen lernen.
%20(2).avif)
%20transparent.avif)


