Midjourney ist das AI-Tool, mit dem wir über den Browser die faszinierendsten Bildwelten erschaffen können. Es ist genau das Tool, mit dem der Papst in der hippen Daunenjacke dargestellt wurde, der vermeintliche Emanuel Macron mitten in den französischen Protesten Steine geworfen hat oder die Fake Aufnahmen von Donald Trump scheinbar mitten in der gewaltsamen Festnahme in New York City erstellt wurden.
Midjourney gehört vor allen Dingen deshalb zu den beliebtesten Tools wegen der „einfachen“ Bedienung (zumindest auf den ersten Blick – die richtigen Prompts zu finden, ist dann nicht ganz so trivial) und der ästhetisch ansprechenden Ergebnisse. Wegen der Deep Fakes, die scheinbar vor allem von kostenfreien Accounts erstellt wurden, ist temporär der freie Zugang zum Tool gesperrt worden. Damit sollen wohl die Zügel etwas fester angezogen werden. Als Bezahlaccount ist meine Identität über meine Bankverbindung ja erkennbar.
Ästhetische Bilder sind nur ein Aspekt
Schöne Bilder sind nur ein Aspekt. Neben den Vorwürfen, man könne gewaltverherrlichende oder (kinder)pornographische Inhalte erstellen oder eben Fake News produzieren, ist eine weitere Frage, welche Vorurteile sich in den produzierten Bildern widerspiegeln. Vor einigen Wochen hatte ich einem LinkedIn Post schon darüber berichtet, dass viele Text-To-Image AI Programme, wenn sie sich eine AI als Person vorstellen, überwiegend eine junge weiße Frau darstellen, manchmal auch einen Mann. Der schlichte Prompt „ChatGPT“ führte zu 100% zu Bildern von weißen Männern.
Heute soll es wieder einen Bias-Check geben.
Die unterschiedliche Wahrnehmung von Frauen und Männern
Am vergangenen regnerischen Wochenende hatte ich dann die Idee – angeregt durch einen Reddit Post – meinen ChatGPT Midjourney Prompt Generator zu bitten, für jede der sieben Todsünden einen Prompt jeweils als Personifizierung eines Mannes und einer Frau zu erstellen ohne Vorgaben, ob das Bild im Stil einer Fotografie oder einer bestimmten Kunstrichtung erstellt werden soll. Das sollte dann in der „Entscheidungsfreiheit“ der KI liegen, also zeigen, wie unterschiedlich das Bild von Männer und Frauen eventuell ist.
Warum die biblischen sieben Todsünden?
Bei den biblischen Todsünden geht es um die großen Schwächen von uns Menschen, also die Schattenseiten unserer Existenz. Gerade in diesem Kontext finde ich es besonders spannend, wie eine KI (eigentlich zwei: ChatGPT + Midjourney) diese Eigenschaften als Frau bzw. Mann personifiziert darstellt und ob wir generelle Unterschiede erkennen können.
ChatGPT erstellt die Prompts
Los geht’s. Eines vorweg: Midjourney produziert pro Prompt vier Varianten. Ich habe das aus meiner Sicht repräsentativste Bild ausgewählt.
Der Prompt an ChatGPT für alle folgenden Prompts war:
„Please create a prompt for the seven deadly sins, each represented by a man woman“
Ich habe es so simple wie möglich gehalten, damit sowohl ChatGPT als auch im zweiten Schritt Midjourney viel „Gestaltungsfreiheit“ hatten.
Die Midjourney-Prompts pro „Sünde“ von ChatGPT sind direkt unter dem Bild kursiv dargestellt.
Stolz
Interessanterweise werden sowohl der Mann als auch die Frau mit Krone dargestellt – eine eher historische Betrachtungsweise. Was mich überrascht hat, ist die Tatsache, dass die weibliche Variante des Stolzes eine schwarze Hautfarbe hat. Immerhin, die dominante Darstellung von Menschen mit weißer Hautfarbe könnte langsam aufbrechen. Aber für übertriebenen Optimismus gibt es keinen Anlass, denn – Spoiler – es wird die einzige Darstellung eines Menschen mit nicht-weißer Hautfarbe bleiben.
Neid
Die dominante Farbe beim Neid ist grün. Gibt es eigentlich nur im Deutschen den Begriff „grün vor Neid“? Im Englischen ist er mir noch nie begegnet. Wenn ich die Bilder ansehe, würde ich vermuten, dass „grün“ auch in anderen Ländern mit „Neid“ in Verbindung gebracht wird.
Und sonst? Die männliche Version des Neides ist deutlich abstoßender als die weibliche Variante. Der neidische Mann ist eher gruselig, die neidische Frau eine eher unsympathische Schönheit.
Völlerei
Die Völlerei wird in beiden Fällen mit barocker Opulenz dargestellt. Sollte dies ein Kunsthistoriker oder Kunstexperte lesen, würde mich interessieren, ob die Kleidung jeweils aus der Zeit des Barock stammt.
Auch hier wieder: Die weibliche Völlerei ist deutlich attraktiver als die männliche. Im Gegensatz zum Mann scheint sie auch kein schlechtes Gewissen zu haben angesichts ihres Lasters. 😜 Das dürfte in der Realität allerdings eher umgekehrt sein.
Faulheit/Trägheit
Was haben „Faulheit“ und „Völlerei“ gemeinsam? Richtig – in der weiblichen Variante ist die deutlich attraktiver. Die faule Frau liegt sehr hübsch anzusehen auf ihrer Chaiselongue in einem aufgeräumten Schloß während der faule Mann nicht nur ziemlich mürrisch schaut, sondern auch in einer verlotterten Wohnung dargestellt wird. Wir möchten hier gar nicht wissen, wie es in den anderen Räumen aussieht. Die weibliche Variante sieht eigentlich nur nach Luxusleben aus und wir könnten uns die Frage stellen, was an Faulheit eigentlich so verwerflich ist.
Beim Zorn dreht Midjourney richtig auf, was natürlich auch an dem von ChatGPT generierten Prompt liegt. Die männliche Variante ist nicht einmal mehr ein Mensch, sondern eine Art Feuer-Zombie. Die Frau ist hier zwar in ihren körperlichen Merkmalen immer noch attraktiv, durch die realistischere Darstellung ist sie auch furchteinflößender. Sie wirkt, als hätte sie gerade Blutbad angerichtet.
Die Gier wird mittelalterlich dargestellt (Kunstexperten – stimmt das?). Interessant, dass hier keine moderne Bildwelt gewählt wurde. Und auch hier erkennen wir ein Muster: der gierige Mann ist abstoßend mit seinen langen buschigen Augenbrauen und den knochigen Fingern – beide sind im Prompt nicht beschrieben, das ist also die Interpretation von Midjourney. Die gierige Frau ist wie immer eine Schönheit, „der Geiz in den Augen“ ist nicht übernommen worden (wie sieht das überhaupt aus?)
Wie Ihr seht, seht Ihr nichts. Das Absetzen des Prompts hat mich fast den Midjourney Account gekostet. Midjourney hat sich an den Worten „Lust“, „desire“, provocative“, „temptation“ und „sensuality“ gestört. Aktuell stehe ich „unter Beobachtung“.
Ich habe dreimal versucht, die Prompts abzuschwächen, indem ich Synonyme für die gesperrten Wörter gesucht habe, es hat mich nicht weiter gebracht. Daran erkannt ihr, wie scharf die Richtlinien in Bezug auf erotische/pornografische Inhalte mittlerweile geworden sind.
Fazit
Alle sechs Versuche zeigen vor allen Dinges eines:
Die Dominanz von Menschen weißer Hautfarbe
Frauen werden attraktiver dargestellt als Männer, durchweg mit den gängigen Attributen, die dem Schönheitsideal der westlichen Welt entspricht.
Extrem strenge Zensur, um die Erstellung anstößige Bilder zu verhindern. Kontext wird dabei nicht beachtet. Prompts, die beispielsweise das Wort „provokativ“ enthalten, werden grundsätzlich geblockt. Ein provokativ dreinblickendes Katzenbaby kann genauso wenig erstellt werden wie ein „provokativer“ Mensch. Da ist noch einiges zu tun. Wer sich Mühe gibt, wird vermutlich durch entsprechende Umschreibungen immer noch Erotik oder Gewalt darstellen können.