Gilgen Textbox Workflow-Leitfaden

comfyui gligen

Was ist GLIGEN?

GLIGEN (Generierung von Sprache zu Bild) ist ein fortschrittliches KI-Modell, das die traditionelle Text-zu-Bild-Generierung um eine präzise räumliche Steuerung erweitert. Anstatt nur zu beschreiben, was Sie von Ihrem Bild erwarten, können Sie mit GLIGEN genau angeben woher Objekte sollten mithilfe von Begrenzungsrahmen angezeigt werden.

Die wichtigsten Vorteile:

  • Präzise Objektplatzierung: Kontrollieren Sie genau, wo Elemente in Ihrem Bild erscheinen
  • Steuerung mehrerer Objekte: Positionieren Sie mehrere verschiedene Objekte gleichzeitig
  • Verbesserte kreative Kontrolle: Gehen Sie über einfache Textaufforderungen hinaus und nutzen Sie eine detaillierte räumliche Komposition

Wer hat GLIGEN gegründet?

GLIGEN wurde von Forschern und Ingenieuren entwickelt aus:

  • Universität von Wisconsin-Madison
  • Universität Columbia
  • Microsoft

Das Modell baut auf bestehenden Diffusionsmodellen wie Stable Diffusion auf und bietet gleichzeitig bahnbrechende Funktionen zur räumlichen Konditionierung.

So funktioniert GLIGEN

Kernkonzept

GLIGEN kombiniert zwei Arten von Eingaben:

  1. Textaufforderungen - Beschreiben Sie, was Sie generieren möchten
  2. Bounding Boxes - Definieren Sie, wo bestimmte Objekte platziert werden sollen

Das Modell verwendet einen eingefrorenen CLIP-Text-Encoder und injiziert räumliche Informationen durch spezielle trainierbare Ebenen, wodurch das umfangreiche Wissen vortrainierter Modelle erhalten bleibt und gleichzeitig eine präzise Steuerung ermöglicht wird.

Koordinatensystem

  • Startpunkt: Obere linke Ecke (0,0)
  • X-Achse: Erhöht sich bei Bewegung nach rechts
  • Y-Achse: Zunehmend nach unten
  • Einheiten: Pixelkoordinaten

Verwendung von GLIGEN in Promptus CosyFlows

Was ist CosyFlows?

CosyFlows ist die benutzerfreundliche Oberfläche von Promptus, die ComfyUI für technisch nicht versierte Benutzer zugänglich macht über:

  • Workflow-Erstellung per Drag-and-Drop
  • Visuelles Feedback und Vorschauen
  • Vorgefertigte Vorlagen
  • Zero-Code-Ansatz

Schrittweiser Arbeitsablauf

1. Richten Sie Ihren Basis-Workflow ein

  • Beginnen Sie mit einem Standard-Text-zu-Bild-Workflow in CosyFlows
  • Fügen Sie Ihre grundlegenden Komponenten hinzu: Modelllader, Textaufforderung, Sampler, VAE-Decoder

2. Fügen Sie den (gemütlichen) GLIGEN Textbox Node hinzu

  • Ziehen Sie den Knoten GLIGEN Textbox Apply in Ihren Workflow
  • Dies ist die benutzerfreundliche Version des Standard-GLIGEN-Knotens von Promptus

3. Konfigurieren Sie Ihre Haupteingabeaufforderung

  • Schreiben Sie Ihre vollständige Bildbeschreibung wie gewohnt
  • Beispiel: „Eine ruhige Strandszene mit einem roten Sonnenschirm, einem Golden Retriever und einem Segelboot“

4. Räumliche Steuerungen einrichten

Für jedes Objekt, das Sie genau positionieren möchten:

Eingabefelder:

  • Text: Der spezifische Objektname (muss mit etwas in Ihrer Haupteingabeaufforderung übereinstimmen)
  • Breite: Wie breit der Begrenzungsrahmen sein soll (in Pixeln)
  • Höhe: Wie hoch der Begrenzungsrahmen sein sollte (in Pixeln)
  • X-Position: Horizontale Position vom linken Rand
  • Y-Position: Vertikale Position von der Oberkante aus

Beispielkonfiguration:

Objekt 1: „roter Schirm“
- Breite: 200, Höhe: 300
- X: 100, Y: 50

Objekt 2: „Golden Retriever“
- Breite: 250, Höhe: 200
- X: 400, Y: 300

Objekt 3: „Segelboot“
- Breite: 300, Höhe: 150
- X: 600, Y: 100

5. Verbinde die Knoten

  • Verbinden Sie Ihr CLIP-Modell mit dem GLIGEN-Knoten
  • Verbinden Sie das GLIGEN-Modell mit dem Workflow
  • Verbinden Sie den Ausgang der Konditionierung mit Ihrem Sampler

6. Generieren und iterieren

  • Führen Sie den Workflow aus, um Ihre räumlich gesteuerte Generierung zu sehen
  • Passen Sie die Begrenzungsrahmen nach Bedarf an, um eine bessere Komposition zu erzielen
  • Verwenden Sie die Funktion „Remix“, um Variationen zu generieren

Bewährte Verfahren

Promptes Schreiben

  • Sei spezifisch: Verwenden Sie klare, beschreibende Objektnamen
  • Referenzen abgleichen: Stellen Sie sicher, dass der GLIGEN-Text genau den Objekten in Ihrer Hauptaufforderung entspricht
  • Überlappung vermeiden: Platzieren Sie keine Bounding-Boxen direkt übereinander

Dimensionierung der Bounding-Box

  • Proportionale Größe: Stellen Sie Boxen her, die der Objektgröße entsprechen
  • Lass den Atemraum: Stellen Sie die Boxen nicht zu eng um Objekte herum
  • Kontext berücksichtigen: Berücksichtigen Sie, wie Objekte mit dem Hintergrund interagieren

Workflow-Optimierung

  • Einfach starten: Beginne mit 1-2 Objekten und füge dann weitere hinzu
  • Vorlagen verwenden: Nutzen Sie die vorgefertigten GLIGEN-Workflows von Promptus
  • Erfolgreiche Setups speichern: Erstellen Sie wiederverwendbare Workflows für gängige Kompositionen

Tipps zur Problembehebung

Objekte erscheinen nicht an der richtigen Stelle:

  • Stellen Sie sicher, dass Ihr Text genau mit der Haupteingabeaufforderung übereinstimmt
  • Stellen Sie sicher, dass die Koordinatenwerte innerhalb der Bildgrenzen liegen
  • Probiere größere Bounding-Boxes aus

Ergebnisse von schlechter Qualität:

  • Stellen Sie sicher, dass Ihre Basisaufforderung gut geschrieben ist
  • Prüfen Sie, ob das GLIGEN-Modell ordnungsgemäß geladen ist
  • Passen Sie die Sampling-Einstellungen bei Bedarf an

Objekte, die außerhalb der Boxen bluten:

  • Erhöhen Sie die Stärke der räumlichen Konditionierung
  • Verwenden Sie spezifischere Objektbeschreibungen
  • Versuchen Sie, die Richtungsskala anzupassen

Fortgeschrittene Techniken

Mehrere GLIGEN-Knoten

  • Verketten Sie mehrere GLIGEN-Textbox-Knoten für komplexe Szenen
  • Jeder Knoten kann verschiedene Objekte unabhängig voneinander steuern.
  • Kompositionen Schicht für Schicht aufbauen

Kombinieren mit anderen Knoten

  • Verwenden Sie es mit ControlNet für zusätzliche Anleitungen
  • Kombinieren Sie es mit Inpainting für raffinierte Ergebnisse
  • Integrieren Sie mit Style-Transferknoten

Batch-Generierung

  • Verwenden Sie die Batch-Funktionen von Promptus, um mehrere Varianten zu generieren
  • Testen Sie schnell verschiedene räumliche Anordnungen
  • Erstellen Sie effizient Lookbooks oder Styleguides

Erste Schritte mit Promptus

  1. Melde dich an beim promptus.ai
  2. Stöbern Sie in der Galerie für GLIGEN Workflow-Vorlagen
  3. Forke eine Vorlage oder erstelle einen neuen CosyFlow
  4. Experimentieren mit dem (gemütlichen) GLIGEN Textbox-Knoten
  5. Teilen und remixen deine erfolgreichen Workflows mit der Community

Fazit

GLIGEN in Promptus CosyFlows demokratisiert fortschrittliche räumliche Kontrolle bei der KI-Bildgenerierung. Egal, ob Sie ein Designer sind, der präzise Layouts erstellt, ein Künstler, der sich mit der Komposition befasst, oder ein Vermarkter, der eine konsistente Produktplatzierung benötigt, GLIGEN bietet die Tools, mit denen Sie Ihre kreative Vision mit beispielloser Kontrolle und Leichtigkeit in die Realität umsetzen können.

Reviews

What our community is saying about us

ai art illustrator
Jose Romero
Illustrator
ai art generator
Dmitry Selivanov
Art director
ai art brand
Sadiya Abdullah
Brand agency
ai video generator
Lupe Rodriguez
Product designer
ai art graphic designer
Dianne Russell
Graphic Designer
ai game designer
Marie McKinney
Game designer
ai image generator

Teilen Sie Ihre Rechenleistung

Schließen Sie sich unserem GPU-Rechennetzwerk an. Helfen Sie uns, KI für Designer, Entwickler und
Startups zugänglich, skalierbar und sicher zu machen.

promptus ai video generator
FAQs
FAQ-Sektion
Was ist Promptus?

Promptus ermöglicht es Nutzern, individuelle KI-Videos, hochauflösende Bilder, KI-Charaktere, Musik und mehr mit den aktuellsten Modellen zu erstellen.

Wer kann Promptus nutzen?

Jeder – von Designern und Marketern bis hin zu Hobbyisten und Anfängern.

Was ist ein KI-Kunstgenerator?
Was ist dezentrales GPU-Computing?
Kann ich ComfyUI nutzen?
Erstelle einfach deinen nächsten KI-Workflow mit Promptus
Go from idea to production-ready output in minutes.
Promptus kostenlos testen ➜