KI und Kunst – Wie verändert KI die Kunst- und Kulturindustrie?

Seit der Veröffentlichung des textgenerierenden Chatbots ChatGPT im November 2022 sind Diskussionen und Berichterstattungen über die Potentiale und Gefahren künstlicher Intelligenzen im gesellschaftlichen Diskurs nicht mehr wegzudenken. Ob Papst Franziskus im hippen Daunenmantel, der verstorbene Michael Jackson, der mit seinem Cover von Eye Of The Tiger auf TikTok trendet oder die textgenierende KI ChatGPT, die das US-Medizinexamen mehrfach erfolgreich abgelegt hat – die (sozialen) Medien sind voll mit Beispielen und Experimenten, die die Möglichkeiten und Grenzen von unterschiedlichen künstlichen Intelligenzen austesten und demonstrieren.

Auch in der Filmproduktion wird der Einsatz von KI-Techniken immer präsenter. Während die Entwicklung von Animationsfilmen, die Integration von KI-generierten Bildern oder Deep-Fakes bereits seit mehreren Jahren etabliert sind, wird KI zunehmend in der Nachbearbeitung von Filmen eingesetzt, um misslungene Improvisationen zu korrigieren, die Synchronisation zu verbessern oder tote Stimmen wieder auferstehen zu lassen.

Letzteres sorgte 2022 durch die Veröffentlichung der Netflix-Miniserie The Andy Warhol Diaries für Diskussionen, in der der Regisseur Andrew Rossi in Zusammenarbeit mit dem Unternehmen Resemble AI die Stimme des verstorbenen Künstlers wieder zum Leben erweckte.[1] Auf der Grundlage einer 3-minütigen Tonaufnahmen des echten Andy Warhols entwickelte das Unternehmen mit Hilfe einer Deep-Fake Technik Tonspuren, die Warhol aus seinem eigenen Tagebuch vorlesen ließen. Die KI analysierte die charakteristischen Phänomene seiner Stimme aus der Originalaufnahme und berechnete so wie andere Laute, Akzente oder Emotionen, die in der Originalaufnahme nicht zu hören sind, wahrscheinlich klingen würden. Danach konnte der gewünschte Text in die KI eingefügt werden und das Resultat klingt, zumindest für diejenigen, die Andy Warhol nie „in echt“ haben sprechen hören und nur die Originalaufnahme als Vergleich haben, erstaunlich echt.

In dem amerikanischen Survival Thriller Fall, der ebenfalls 2022 erschien, wurde künstliche Intelligenz dafür genutzt, um Tonaufnahmen im Nachhinein zu verändern, da der gesprochene Text der beiden Hauptdarstellerinnen, der aus der Anweisung zur Improvisation entstand, nicht den Vorstellungen der Produzenten entsprach. Aufgrund der häufigen Verwendung des Wortes „Fuck“ wurde der Film von der Motion Pictures Assosiation, eine amerikanische Organisation, die für die Altersempfehlungen von Filmen zuständig ist, als „restricted“, also ab 17 Jahren, eingestuft. Da die Produzenten mit dieser Beschränkung die Einnahmen des Films bedroht sahen und kein Budget für einen erneuten Dreh der Szenen zur Verfügung stand, entschieden sie sich die Sprache und die Mundbewegungen der misslungenen Szenen mit Hilfe von KI gesteuerten Programmen zu korrigieren. 

Die KI des Unternehmens Flawless analysierte die Mundbewegungen der Darstellerinnen anhand des gedrehten Materials und wurde dann so trainiert, dass sie die Mundbewegungen der Darstellerinnen beliebig nachmachen können. Somit konnte das gesprochene Wort der Schauspielerinnen im Einklang mit den Mundbewegungen nachbearbeitet werden, ohne die Szenen erneut zu drehen. Die „Fucks“ wurden durch das harmlosere Wort „Freaking“ ersetzt und der Film wurde nach einer erneuten Überprüfung der Motion Pictures Assosiation als PG-13-, also ab 13 Jahren, eingestuft. Zudem nutzen die Produzenten die KI zur Synchronisation, indem sie die Lippen- und Gesichtsbewegungen der Darstellerinnen an die jeweils andere Sprache anpassten.[2]

Neben den bild- und tongenerierenden KIs steht die textgenerierende KI ChatGPT immer wieder im Mittelpunkt in Diskussion um die Zukunft des Schreibens. Der Chatbot ist nicht nur in der Lage ein Medizinexamen zu bestehen, sondern kann zudem textbasierte Inhalte wie Drehbücher, Gedichte, Witze oder Dialoge produzieren, die normalerweise in dem Prozess menschlicher Kreativität entstehen.  

Aber kann künstlicher Intelligenz wirklich kreativ sein? 

Eine der größten Stärken von KI ist ihre Fähigkeit, große Datenmengen schnell und genau zu verarbeiten. Dies ist besonders nützlich, um routinierte Prozesse zu automatisieren und effizierter zu gestalten. Jedes Ergebnis, das ChatGPT auf eine Anfrage liefert, beruht auf Wahrscheinlichkeitsberechnungen von unterschiedlich möglichen Ergebnissen, die die KI aus den vorher antrainierten Datenmengen ableitet. Die Drehbücher, Gedichte, Witze oder Dialoge, die ChatGPT anhand eines Inputs produzieren kann beruhen also auf Wahrscheinlichkeitsberechnungen aus Datenmengen und unterscheiden sich stark von dem Prozess der menschlichen Kreativität, der oft mit Fantasie, neuen Ideen und der innovativen Kombination verschiedener Themen assoziiert wird. Dies zeigt sich auch in der Qualität der Ergebnisse des Chatbots, die oft sehr einfach und allgemein klingen und die vermutlich von Kunst- und Kulturkritiker*innen als „nicht sonderlich einfallsreich beschrieben werden würden.

Künstliche Intelligenz kann also, aufgrund der unterschiedlichen Informationsverarbeitung, nicht den Denkprozess durchführen, den wir allgemein als „kreativ“ bezeichnen. Dies schließt allerdings nicht aus, dass KI in Zukunft Menschen bei der Produktion von textbasierten Inhalten für Film,- Fernsehen oder die darstellenden Künste unterstützen kann.

Diese drei Beispiele zeigen, dass die Entwicklung von künstlicher Intelligenz nicht nur in Form von Navigations- oder Sprachassistenzsystemen präsent ist, sondern längst ein Bestandteil des theoretischen- und praktischen Diskurses um die Zukunft der Produktion und Rezeption von Kunst und Kultur ist. Neben den ethischen Fragen, zum Beispiel, ob es ethisch vertretbar ist, die Stimme eines Toten zu reproduzieren und dem Problem der Reproduktion von diskriminierenden Strukturen, stellt sich insbesondere die Frage, inwiefern sich der Arbeitsmarkt verändern wird. Wird der zunehmende Einsatz von künstlicher Intelligenz in der Nachbearbeitung von Filmen zu einem Ende des Berufs der Synchronsprecher führen? Kann künstliche Intelligenz kreativ sein wie wir Menschen? Inwiefern kann die Kombination von menschlicher und künstlicher Textproduktion zu spannenden Geschichten führen?

Mit Blick auf Filme wie Babylon (2022), die die Auswirkungen der technischen Revolution des Tonfilms auf die Filmproduktion durch Einzelschicksale erfolgreicher Stummfilmschauspieler erzählen, frage ich mich zudem: Werden wir in 100 Jahren neugierig auf die Skepsis gegenüber dem Einsatz künstlicher Intelligenzen in der Filmproduktion blicken, wie wir es heute auf die Revolution des Tonfilms in den 1920er Jahren tun?

Insgesamt bin ich überzeugt, dass verschiedene KI-Systeme in Zukunft stärker in alle Bereiche des gesellschaftlichen Diskurses integriert werden. Die Aufgabe von Kulturschaffenden und Kulturwissenschaftler*innen ist es, in Zusammenarbeit mit KI-Expert*innen über die Möglichkeiten, Chancen und Folgen der Integration von künstlicher Intelligenz in künstlerische Arbeitsprozesse zu diskutieren, zu experimentieren und nach Kooperationsmöglichkeiten für eine innovative Kunst- und Kulturlandschaft der Zukunft zu suchen. 


[1] zu sehen hier: https://www.netflix.com/search?q=warhol&jbv=81026142

[2] zu sehen hier: https://youtu.be/iQ1OPpj8gPA, mehr über diese Technik hier: https://youtu.be/Vkkx9WBCcwk