Aktuellen Studien zufolge ist aufgrund von KI-Anwendungen in den nächsten Jahren mit massiven Einkommenseinbußen für UrheberInnen zu rechnen. Deshalb formiert sich mittlerweile (nach Musterprozessen in den USA) auch in Europa Widerstand. So hat die deutsche Verwertungsgesellschaft GEMA bereits Klage gegen Open AI eingereicht, weil sie das unentgeltliche Einspeisen urheberrechtlich geschützter Werke in generative KI-Anwendungen zu Lasten ihrer Mitglieder nicht mehr hinnehmen will.
Bislang waren es nur Vermutungen, aufgrund generativer KI-Anwendungen würden Urheber:innen schon bald Verluste hinnehmen müssen. Nun liegen zum ersten Mal konkrete Zahlen auf dem Tisch, und die sind besorgniserregend. Einer globalen Studie zufolge, die der internationale Dachverband der Autoren und Komponisten Cisac in Auftrag gegeben hat, und die vor wenigen Tagen veröffentlicht wurde, werden Urheber:innen von Musik und audiovisuellen Inhalten aufgrund generativer KI-Anwendungen bis 2028 rund ein Viertel ihrer Einnahmen verlieren. Genauer gesagt geht die Studie von einem Einnahmenverlust von 21 Prozent für den audiovisuellen Bereich und von 24 Prozent für den Musikbereich aus.
Großer Schaden
Cisac-Präsident und ABBA-Musiker Björn Ulvaeus sah laut einem verlautbarten Statement in KI zwar “neue und aufregende Möglichkeiten”, allerdings müsse man akzeptieren, “dass generative KI, wenn sie schlecht reguliert ist, auch die Macht hat, menschlichen Urheber:innen, ihren Karrieren und ihrer Lebensgrundlage großen Schaden zuzufügen”. Die vereinzelt geäußerte Kritik, Ulvaeus prangere damit etwas an, was er selber (für seine KI-unterstützte ABBA-Show mit virtuellen Versionen der vier ABBA-Mitglieder in London) nutze, geht nicht nur ins Leere, sie ist geradezu absurd. Denn eine Technologie zu nutzen ist das eine, sie auf der Basis von Rechtsverletzung aufzubauen das andere. Ulvaeus verletzt schließlich keine Rechte Dritter, wenn er seine eigene Musik von Avataren performen lässt.
Davon, dass sich viele Einrichtungen zunehmend KI-generierter Musik bedienen, um sich AKM-Abgaben zu sparen, kann sich jeder selbst überzeugen. Der Shazam-Praxistest macht manchmal sicher. Ich selbst hörte im abgelaufenen Jahr einmal in einem Strandbad, ein zweites Mal in einem Viersterne-Hotel – beide Male lief derselbe Mix, eine mit Electro-Beats und Autotune angereicherte Oldies-Cover-Sammlung – und neulich sogar im Restaurant eines renommierten Kulturbetriebs KI-generierte Musik. Während in den Sälen die Kultur hochgehalten wird, läuft in der Bar also bereits KI-Konservensound. Das Frappierende: Außer mir schien der offenkundige Qualitätsverlust niemanden groß zu stören.
Von noch drastischeren Zahlen als den eben genannten geht eine von GEMA und SACEM gemeinsam beauftragte Studie aus, die Goldmedia im Zeitraum Juli 2023 bis Januar 2024 zum Einsatz von künstlicher Intelligenz in der Musikbranche in Deutschland und Frankreich durchgeführt hat
Dafür wurden 15.073 Personen, die haupt- oder nebenberuflich als Komponist:innen, Textdichter: innen oder für Musikverlage tätig sind, befragt. Viele der Befragten arbeiten zugleich auch als ausübende Künstler:innen, Produzent:innen oder für Musiklabels. Darüber hinaus wurden 16 Interviews mit Expert:innen (u. a. Künstler:innen, Wissenschaftler:innen, KI-Software-Anbieter, Streaming-Dienste und andere Akteur:innen aus dem Musiksektor) durchgeführt.
Die Studie schätzt das Umsatzvolumen für generative KI im Musikbereich auf 300 Mio. US$ im Jahr 2023, was rund 8 % des Gesamtmarktes für generative KI mit Umsätzen von rund 3,7 Mrd. US$ im Jahr 2023 entspricht. Der Markt für KI-basierte Dienste im Bereich der Musik werde sich bis 2028 voraussichtlich um mehr als das Zehnfache erhöhen, so die Studie, und zwar mit einer durchschnittlichen jährlichen Wachstumsrate von 60 % auf über 3 Mrd. US$ allein für Musik-KI. Der Markt werde demzufolge in nur wenigen Jahren eine Größe errei- chen, die rund 8 % der weltweiten Musikurheberrechtserlöse (Stand 2022) entspricht.
Und sie geht letztlich von noch größeren Einbußen aus. Durch KI drohe in den kommenden Jahren eine Einkommenslücke für Musikschaffende von bis zu 27%.
Diebstahl, Rasur oder beides?
Fakt ist, dass es bis heute keine Vergütung für urheberrechtlich geschützten Input in die KI gibt, was der deutsche Wissenschaftsjurist Ranga Yogeswar mehrfach als den “größten Diebstahl in der Menschheitsgeschichte” bezeichnet hat. Matthias Hornschuh, deutscher Filmkomponist und Sprecher der Kreativen der deutschen Initiative Urheberrecht, hat im Interview mit dem mica davon gesprochen, dass KI den Markt “rasiere” und das gerade zu einem Zeitpunkt, als die Branche nach einigen schlimmen Jahren aufgrund der Verluste durch die Geschäftsmodelle großer Plattformen (Youtube & Co) wieder Boden unter die Füße gekriegt hätte, “weil wir uns seit drei, vier Jahren in einer Situation befinden, in der über die Verwertungsgesellschaften und die Labels tatsächlich ein Wachstum aus dem digitalen Markt entstanden ist, mit dem es sich wieder in Richtung Tragfähigkeit bewegt”, was über zwanzig Jahre gedauert habe. “Gerade an diesem Punkt nun, wo Online-Erlöse zu den größten Spartenerträgen gehören, kommt die nächste Technologie und rasiert uns den Markt. Und zwar vollständig, weil nicht nur Musik, sondern auch Film, Buch und Fotografie gleich mitrasiert werden”, so Hornschuh. “Es gibt nichts, was nicht zum Training herangezogen worden wäre, soweit es digital verfügbar war.
Eine weitere von der GEMA beauftragte Studie mit dem Titel „Urheberrecht und Training generativer KI-Modelle“, in der sowohl die juristischen als auch die technischen Grundlagen beleuchtet wurden, unterstreicht das. Technisch, so die Studie, handle es sich bei Eingabe ganz klar um eine (urheberrechtlich relevante) Vervielfältigung. Und anhand des Outputs lasse sich nachvollziehen, was “drinnen” ist und durch die Eingabe getriggert wird. Fragt man etwa Chat GPT, ob sie das erste Kapitel von Harry Potter wiedergeben könne, verneint sie zwar, was darauf schließen lässt, dass entsprechende Filter gesetzt wurden, die eine konkrete Nachvollziehbarkeit verhindern. Aufgrund der Tatsache aber, dass man sich das erste Kapitel in einer genauen Zusammenfassung liefern lassen kann, ergebe sich, dass das Werk entgegen dem ersten Anschein zu Trainingszwecken eingespeist worden sein muss. Ähnlich verhält es sich, wenn man die offen zugängliche Version von ChatGPT 4.0 mini derzeit nach dem Songtext von Helene Fischers Song „Atemlos durch die Nacht“ befragt.
Der Chatbot sagt zwar, dass der Text aufgrund des urheberrechtlichen Schutzes nicht vollständig wiedergegeben werden kann. Aber gleichzeitig liefert er Auszüge daraus, die nur den Schluss zulassen, dass ChatGPT die vollständigen Texte kennt. Das liegt daran, dass das KI-Modell dahinter mit den Texten trainiert wurde.
Mittlerweile haben sogar ehemalige Mitarbeiter wie der KI-Forscher Suchir Balaji, zugegeben, dass OpenAI zum Training sehr viel urheberrechtlich geschütztes Material verwendet habe. In einem Interview mit der New York Times sagte er, dass alle englischsprachigen, im Internet auffindbaren Texte (!) in die KI-Modelle von OpenAI eingeflossen seien.
Die herrschende Meinung geht nun aber davon aus, dass Text- und Data-Mining (kurz: TDM) nicht in das Ureberrecht eingreife, weil nur Daten analysiert würden (was allerdings noch nicht bedeutet, dass es auch gratis erfolgen darf). Die genannte Studie stellt im Gegensatz dazu klar, dass die Datenverarbeitung der KI allerdings völlig anderes als bei TDM erfolge. Schon aufgrund der Tatsache, dass ich einer KI auftragen könne, einen bestimmten Stil nachzuahmen, ergebe sich ein klarer Unterschied.
Die GEMA klagt
Die GEMA hat nun als erste Verwertungsgesellschaft weltweit eine Klage wegen unlizenzierter Nutzung von geschützten Musikwerken gegen OpenAI als den Betreiber autogenerativer Chatbot-Systeme erhoben.
Eine vorher gesetzte Frist, die die GEMA vor Einreichung der Klage gesetzt hat, um OpenAI die Möglichkeit zu geben, ohne gerichtliche Auseinandersetzung in Lizenzverhandlungen einzutreten, hat das Tech-Unternehmen – nicht weiter verwunderlich – ungenutzt verstreichen lassen.
In der Klageschrift wirft die GEMA OpenAI vor, geschützte Songtexte von deutschen Urheberinnen und Urhebern wiederzugeben, ohne dafür Lizenzen erworben beziehungsweise die Urheberinnen und Urheber der genutzten Werke vergütet zu haben – das vor dem Hintergrund, dass OpenAI sich zum weltweit führenden Anbieter im Bereich generativer KI entwickelt habe und mittlerweile Umsätze in Höhe von mehr als 2 Milliarden Dollar jährlich erwirtschafte, so die GEMA in ihrer Presseaussendung. Im Jahr 2024 strebe das Unternehmen sogar Umsätze von bis zu 5 Milliarden Dollar an. Das KI-gestützte Sprachsystem ChatGPT, heißt es weiter in der Klage, sei unter anderem auch mit urheberrechtlich geschützten Texten trainiert worden, darunter Songtexte aus dem Repertoire der rund 95.000 GEMA Mitglieder. Vergütet werden sie für die Nutzung ihrer Werke bislang nicht.
Songs sind kein kostenloser Rohstoff
Die Klage richtet sich an die Europaniederlassung von OpenAI in Irland und die Muttergesellschaft, die ihren Sitz im Silicon Valley hat. Unterstützt wird sie von zahlreichen deutschen Musikschaffenden.
„Die Songs unserer Mitglieder sind nicht der kostenlose Rohstoff für die Geschäftsmodelle der Anbieter generativer KI-Systeme. Wer diese Songs verwenden möchte, muss eine Lizenz erwerben und die Urheberinnen und Urheber fair vergüten“, ließ sich Tobias Holzmüller, CEO der GEMA, zitieren.
Was bezweckt die Klage? Vereinfacht gesagt will sie, dass die rund 95.000 GEMA-Mitglieder, zu denen unter anderem Musiker:innen und Songtexter:innen gehören, für die Nutzung ihrer Werke von OpenAI Geld bekommen. Eingebracht wurde die auf Unterlassung, Auskunft und Festsetzung einer Schadenersatz-pflicht gerichtete Klage vor dem Landgericht München.
Es spricht vieles dafür, dass das von der GEMA eingeleitete Verfahren ein Musterverfahren wird, wie mit dem geschilderten Umstand der massenweise erfolgten Datenverarbeitung durch KI umzugehen ist. Spannend wird, ob sich Open AI in das Verfahren einlässt, ob weitere Verwertungsgesellschaften (wie z.B. die AKM) dem Beispiel der GEMA folgen und ob, wenn es zum Verfahren kommt, das Gericht der (noch) herrschenden Meinung folgt, der Input sei durch Text- und Data-Mining gedeckt oder der im GEMA-Gutachten festgehaltenen, die Verarbeitung durch KI sei schon rein technisch von Text- und Datamining zu unterscheiden – und völlig unabhängig davon, ob eine solche Verarbeitung ersatzpflichtig ist. Es ist jedenfalls Feuer am Dach. Wir bleiben dran.
Markus Deisenberger