DragGAN: Bildmanipulation, wie du sie noch nie gesehen hast.
DragGAN ist die neueste KI basierte Technik zur interaktiven Manipulation von Bildern. Warum ist sie revolutionär?
Photoshop hat schon viel geboten – aber einen Gesichtsausdruck per Klick ändern? Und das in Sekundenschnelle? Die KI basierte DragGAN macht es möglich.
Unter Bildmanipulation verstehen wir die Fähigkeit, ein Bild so zu verändern, dass es unseren Vorstellungen und/oder Anforderungen entspricht. Das kann bedeuten: die Pose einer Person ändern, die Form eines Objekts anpassen oder den Gesichtsausdruck verändern.
DragGAN revolutioniert mit Hilfe von KI die Manipulation von Bildern in einer Weise, die wir vor Kurzem noch für unmöglich gehalten haben.
Mit DragGAN kann man Bilder spielend und in Echtzeit verformen. Wie funktioniert das?
Mit DragGAN wählt man Punkte auf einem Bild aus und zieht sie genau an die Stelle, an der man sie haben will. Das restliche Bild passt sich entsprechend an.
Um das zu erreichen, besteht DragGAN aus zwei Hauptkomponenten. Die erste Komponente sorgt dafür, dass sich die ausgewählten Punkte in Richtung des Zielpunkts bewegen. Damit wird die gewünschte Position im Wortsinn punktgenau definiert.
Die zweite Komponente ist eine KI-basierte Methode zur Verfolgung der Punkte. Sie nutzt spezielle Eigenschaften von künstlichen neuronalen Netzwerken, um die Position der Punkte zu bestimmen.
Damit werden völlig neue Möglichkeiten eröffnet. Man kann die Pose und/oder die Mimik ändern, Objekte in verschiedene Formen bringen oder die Anordnung von Elementen auf einem Bild verändern. Egal, ob es sich um Tiere, Autos, Menschen oder Landschaften handelt – mit DragGAN kann man sie nach den eigenen Vorstellungen anpassen. Zudem funktioniert DragGAN interaktiv, sodass man die Veränderung in Echtzeit sehen kann.
Ein spezielles künstliches neuronales Netzwerk ist die Basis von DragGAN .
DragGAN (https://vcai.mpi-inf.mpg.de/projects/DragGAN/) basiert auf einem künstlichen neuronalen Netzwerk, das Generative Adversarial Network (GAN) genannt wird. Dadurch erzeugt es realistische Ergebnisse, selbst in schwierigen Situationen wie zum Beispiel, wenn Teile des Bildes verdeckt sind oder die Formen den natürlichen Gesetzen der Physik folgen müssen.
Selbst ausprobieren kann man es übrigens noch nicht, der Quellcode sollte laut GitHub-Seite des Projekts im Juni veröffentlicht werden. Ich persönlich könnte mir vorstellen, dass die Technologie in einem der künftigen Update von Photoshop oder einer anderen Bildbearbeitungssoftware integriert wird .
Echte Fotos, mit DragGAN bearbeitet. Sind sie dann noch echt?
Inzwischen wurde auch gezeigt, dass DragGAN nicht nur auf künstlich erzeugte Bilder angewendet werden kann, sondern auch auf echte Fotos.
Drehen, Lächeln, Klick. Die Bildveränderung ist einfach und einfach unglaublich.
Stell dir vor, du hast ein Portraitfoto aufgenommen und möchtest die Pose der Person ändern.
Mit DragGAN kannst du die Arme oder Beine an eine andere Position ziehen, um die gewünschte Pose zu erreichen. Du kannst auch den Ausdruck im Gesicht anpassen, um eine bestimmte Emotion zu erzeugen. Oder vielleicht möchtest du die Komposition des Bildes verändern, indem du Elemente verschiebst oder hinzufügst.
Science Fiction? Mitnichten. Hier eine kleine Demonstration:
DragGAN: Vorteilhaft oder gefährlich? Entscheide selbst.
Vorteile und Risiken von DragGAN:
- Kreative Freiheit
DragGAN ermöglicht es Fotografen die Komposition anzupassen, um das gewünschte Ergebnis zu erzielen. Im künstlerischen Bereich kann man die eigene Vision u.U. leichter und möglicherweise besser umsetzen.
- Geschwindigkeit.
Mit DragGAN kann man Änderungen in Echtzeit vornehmen. Das spart Zeit im Vergleich zu bisherigen Bearbeitungsmethoden. Komplizierte und zeitaufwändige Bildbearbeitung, z.B. in Photoshop, wird u.U. überflüssig. - Realistische Ergebnisse.
DragGAN erzeugt unglaublich realistische Ergebnisse. Die Bildmanipulation wirkt glaubwürdig und natürlich. - Authentizität und das Gesetz.
Bei der Verwendung von DragGAN soll (müsste!) angegeben werden, dass das Bild manipuliert wurde. Bisher gibt es dafür aber keine gesetzliche Grundlage – und zwar weltweit einheitlich. Wird wirklich jede/r so ehrlich sein? In Deutschland gibt es mittlerweile Gesetzesvorlagen (https://www.bundestag.de/dokumente/textarchiv/2023/kw13-pa-digitales-ki-938580) , die Entwicklung der KI ist aber schneller. Der Gesetzgeber hingt meilenweit hinterher. - Manipulation von Portraits.
Durch Manipulationen können Porträts so verändert werden, dass die Identität der abgebildeten Person verfälscht wird und mitunter unrealistische Schönheitsideale entstehen. Dies kann vor allem bei Teenagern den Druck verstärken, einem idealisierten Schönheitsbild zu entsprechen. - Missbrauch.
Wie bei jeder Technologie besteht die Gefahr des Missbrauchs. Sowohl Fotografen*innen als auch die Personen auf dem Portrait sollten eine Vertragsgrundlage schaffen, die jegliche Bildmanipulation entweder ausschliesst, oder klar definiert.
Mein Fazit. Wo viel Licht ist, ist auch viel Schatten.
DragGAN bietet Fotografen*innen Vorteile, birgt aber auch große Gefahren. Einerseits ermöglicht KI basierte Bildbearbeitung kreative Freiheit, schnelle Anpassungen und realistische Ergebnisse. Allerdings birgt sie auch die Gefahr der Verfälschung der Identität, idealisierte Schönheitsstandards, Fehlinformationen und des allgemeinen Verlustes von Glaubwürdigkeit. Das gilt nicht nur für private Fotos, sondern – vor allem – für die mediale Berichtserstattung, Stichwort “fake news”.
KI-basierte Technologien sind die Zukunft – ob uns das gefällt oder nicht. In der Bildbearbeitung (und nicht nur dort!) tut sich sehr viel und es gibt tolle und sinnvolle Tools, die deine Arbeitszeit am Rechner signifikant minimieren können – speziell, wenn du Familien- oder Hochzeitsfotograf*in bist.
Am 08. Juli im Workshop werde ich alle “Tricks” zeigen. Sei dabei!