„Alle haben ein Level, ab dem sie nicht mehr gut spielen” – WOLFGANG SCHRAMML (Sonic Flow) im mica-Interview

Wolfgang Schramml ist Produzent. Als Profi-Musiker spielt er selbst einige Instrumente, sein Hauptinstrument ist allerdings eindeutig das Studio “Sonic Flow” in Salzburg, dessen guter Ruf geht weit über die regionalen Grenzen hinausgeht. Die Referenzen reichen von The Seesaw bis DJ Ötzi, von Hubert von Goisern bis Christian Muthspiel. Mit Markus Deisenberger sprach er über die Produktionsweisen von Rick Rubin und Steve Albini, warum er Spezialpreise für “Local Heroes” hat und weshalb er jahrelang nur für die Bank gearbeitet hat. Darüber hinaus verriet er, wie er so lange in einer schwierigen Branche überlebt hat und inwiefern Künstliche Intelligenz gerade den Markt verändert.

Wenn ich in den letzten Jahren mit Bands aus Salzburg geredet habe, dann ist auf die Frage, wer ihr aktuelles Album denn produziert habe, in zwei von drei Fällen dein Name gefallen. Du machst viel und bearbeitest eine große Bandbreite, oder?

Wolfgang Schramml: Das Studio gibt es seit 1993, also 31 Jahre lang. Da kommt schon einiges zusammen. Wir haben damals mit Rockbands angefangen, mitunter fünf, sechs Rockbands die Woche aufgenommen.

Da drängt sich die Frage auf: Wie kann man davon leben?

Wolfgang Schramml: Es war eh schwierig. Wir – meine mittlerweile leider verstobene Frau, die auch Musikerin war, und ich – haben damals einen Kredit aufgenommen. Es gab vorher schon ein Studio hier. Der Chef des Studios war mein Mentor. Ich begann ja als Musiker, Maler und Konzeptkünstler und war in der Salzburger Szene unterwegs, habe auf der KOWI studiert, wo es ein von Siegfried Zielinski aus Berlin ins Leben gerufenes Institut gab, das audiovisuelle Labor. Zielinski hat damals Dinge möglich gemacht, die sonst undenkbar gewesen wären.

Eine wunderbare Zeit. Ich habe damals schon Musik gemacht, komponiert, in Bands gespielt und dann eben einen Mentor gefunden. Der war ein sehr guter Techniker, hat aber nicht so gut mit Leuten umgehen können. D.h. er hat gute Produktionen gemacht, die Leute sind aber manchmal nur einmal gekommen. Ich habe damals von meinen Gagen Equipment gekauft und ihm Geld geliehen. Irgendwann hat er dann mal gemeint, warum wir uns nicht auf ein Packerl zusammenhauen. Es ging dann aber finanziell immer mehr bergab mit dem Studio.

Und ich war zwar nicht geschäftlich involviert, aber mein Equipment war da. Wenn in Folge eines Konkurses zugesperrt worden wäre, hätte auch mein Equipment keinen Sinn mehr gemacht. Umgekehrt hätte ich keinen Raum mehr für das Equipment gehabt. Meine Frau und ich haben das Studio dann gekauft. Allein hätte ich mich nicht drüber getraut. Es hat auch lange gedauert, weil die Banken meinten, ein Studio dieser Art rechne sich nicht. Wir haben eine Million Schilling aufgenommen zu einer Zeit, als man 11,4 Prozent Zinsen für einen Kredit zahlte.

Klingt heftig.

Wolfgang Schramml: War auch heftig. Wir haben jahrelang nur für die Bank gearbeitet, wie Sklaven auf dem Baumwollfeld. Ein gutes Unternehmen hat damals zehn Prozent Rendite gemacht. Man kann sich also vorstellen, wie bedient wir waren. Wir haben Tag und Nacht gearbeitet und irgendwann auch angefangen, Werbung zu machen, weil man damit mehr Geld verdienen konnte als mit der Musik. Das heißt, wir haben geschaut, dass wir splitten: Ein Teil Werbung, mit der wir gutes Geld verdienen, und nebenbei zu einem akzeptablen Preis für die Bands arbeiten.

Wenn ich heute einer Band achtzig Euro pro Stunde verrechne, habe ich, wenn ich Monatskosten durch verfügbare Stunden dividiere, nicht einmal die Fixkosten herinnen. Für die Bands ist das aber trotzdem viel Geld. Du brauchst ja schon ein paar Tage, je nachdem welche Musik du aufnimmst. Für mich ist es also verständlich, wenn Bands sagen, dass sie sich das nicht leisten können. Ich habe deshalb einen Spezialpreis für “Local Heroes”. Und das Prinzip ist, das Studio maßgeblich über andere Sachen zu finanzieren. Die Bands müssen trotzdem noch einen Platz haben. So kommen natürlich über die Jahrzehnte viele Sachen zusammen. Irgendwann konnte ich aber keinen Hard Rock und Metal mehr hören. Wenn du das fünf, sechs Tage die Woche machst, vergeht es dir. Wir haben viel Jazz, Avantgarde. elektronische Musik aufgenommen, Pop natürlich sowieso. Dann haben wir irgendwann angefangen, Orchestermusik mobil aufzunehmen – je nachdem, wo sie stattfindet. Wo sie gespielt oder geprobt wird, von Universitäts-Aulen bis zum Festspielhaus. Große Orchester aufzunehmen, war für mich kompositorisch eine große Weiterentwicklung.

Inwiefern?

Wolfgang Schramml: Klassische Musik war nie so mein Ding. Erst als ich sie aufnahm, habe ich zu verstehen begonnen, worum es geht. Die Wichtigkeit der Akustik. Ich komme aus dem Pop und aus der elektronischen Musik. Da geht es um Akkorde, Rhythmen, Basslines und Melodien. Das ist im Grunde genommen ein einfaches Baukastenprinzip. In der Klassik hingegen hast du viele Einzelmelodien, die sich am Ende wie ein Gewebe zusammenfügen. Das hat mir beim Komponieren neue Möglichkeiten erschlossen. Und wichtig war mir auch immer das Arbeiten mit Bands verschiedenster Musikrichtungen. Einen Abend ist Hubert von Goisern da, am nächsten Tag kommen Christian Muthspiel und Benjamin Schmid. Die Bandbreite hat mir immer großen Spaß gemacht. Mit allen diesen Musikerinnen und Musikern kommuniziert man ja auch die ganze Zeit. Ich bin ja nicht nur der Haustechniker, sondern wurde und werde von den Musikerinnen und Musikern auch gerne in Stil-, oder Soundfragen involviert.

Wie weit geht dieses Involvieren? Es gibt ja sehr unterschiedliche Zugänge. Einer Jeff Lynne-Produktion hört man immer an, dass sie von Jeff Lynne ist, egal ob er sich selbst produziert oder jemand anders. D.h. jede Produktion trägt seine persönliche Handschrift. Dann gibt es die Produzenten, die so wie Rick Rubin denken. Er hat einmal sinngemäß gemeint: “Everything happens the way it is supposed to happen. We just watch it unfold.” Er sieht sich also eher als einen Geburtshelfer. Nicht mehr, aber auch nicht weniger. Wo siehst du dich in diesem Spektrum?

Bild Wolfgang Schramml
Wolfgang Schramml

Wolfgang Schramml: Rubin ist ein Rockphilosoph, der seine zen-buddhistische Ader und seine Meditationspraxis ins Produzieren mit hineinnimmt. Wie es halt oft ist, wünscht man sich da manches herbei. Eine Projektion kann auch Wirklichkeit werden, keine Frage. Aber so, wie er es catchy darstellt, ist es in meiner Erfahrung nicht. In seiner vielleicht schon. Steve Albini, der gerade bedauerlicherweise und zu jung verstorben ist, hat das völlig anders gesehen. Er hat sich nie als Produzenten gesehen, weil er das Wort gehasst hat. Es hat ihn zu sehr an die Strukturen der Musikindustrie und ihre ausbeuterischen Verträge erinnert. Er hat das eher marxistisch gesehen.

Er hat es aber auch wirklich durchgezogen, indem er zum Beispiel abgelehnt hat, für das Nirvana-Album “In Utero” Tantiemen zu kassieren. Er hat also nicht nur geredet.

Wolfgang Schramml: Absolut. So gibt es ganz unterschiedliche Producer-Persönlichkeiten. Letztlich haben alle ihren einen eigenen Stil, den sie entwickelt haben.

Aber wo stehst du?

Wolfgang Schramml: Ich habe keinen Produktionsstil. Ich möchte mich voll auf die Band oder die Einzelkünstlerin und den Einzelkünstler einlassen. Ich adaptiere daher den Stil nicht nach Grundsätzen, sondern je nachdem, was die Person oder die Entität Band braucht. Alle gemeinsam brauchen sie einen Blick von außen. Ich versuche nicht unhöflich zu sein, aber trotzdem möglichst ungefiltert zu sagen, was mein erster Eindruck ist. Was ist gut und was kann man im Feinschliff besser machen? Oft spielen die Bands einmal vor, was sie aufnehmen wollen und ich mache dann bestimmte Vorschläge. Gerade erst hatte ich eine Band, deren Nummern wirklich gut waren, aber Bass und Schlagzeug spielten einfach nicht zusammen. Also riet ich ihnen, genau daran gesondert zu arbeiten.

Wie schnell sind die Protagonistinnen und Protagonisten dann beleidigt?

Wolfgang Schramml: Das ist das Feinstoffliche. Früher war es schwieriger, als ich noch keine Credits hatte. Heute ist es eher so, dass Bands, die anfragen, auch wissen, warum sie anfragen. Es gibt ja genug Auswahl. Man muss aber trotzdem aufpassen, weil es einerseits Bands gibt, die wollen, dass ich zu ihrer Verbesserung beitrage. Bei anderen muss man aufpassen, dass man sie nicht entmutig oder verärgert, wenn man ehrlich seine Meinung sagt. Aber ich bin kein unhöflicher Mensch. Wenn ich ehrlich meine Meinung sage und eine Band dann der Meinung ist, ich fände sie nicht geil genug, um mit ihnen zu arbeiten, bin ich wahrscheinlich der Falsche.

Es gibt auch Konstellationen, in denen ich sagen muss: „Ihr seid meiner Meinung noch nicht so weit.” Aber jede Band, die hier in den letzten Jahrzehnten war, hat nach der Aufnahme gesagt, dass sie viel gelernt hat. Die Situation, etwas jetzt in diesem Augenblick zu machen, da hilft kein Bier mehr und kein Kiffen, nicht nächste Woche, sondern heute, ist lehrreich. Oft gibt es auch die Situation, dass eine Band eine Nummer über ihre Verhältnisse spielt. Dann bitte ich oft, sie nur um fünf Beats per minute langsamer noch einmal einzuspielen. Wenn man sich dann beide Versionen hintereinander anhört, fällt schon auf, dass die schnellere Version am Limit war. Das ist wie im Sport: Du kannst nicht immer 102% geben. Das geht sich nicht aus. Vor allem junge Bands machen oft den Fehler, über ihre Verhältnisse zu spielen. Alle haben ein Level, ab dem sie nicht mehr gut spielen, selbst Könner wie Jaco Pastorius.

Das war halt sehr weit oben.

Wolfgang Schramml: Ja, aber brillante Künstlerinnen und Künstler macht nicht nur aus, dass sie eine gute Technik, ein gutes Feeling und Talent haben, und dass sie gut hören, sondern dass sie auch wissen, wo sie gut sind und wo sie diese Zone verlassen, ab wann es aus dem Ruder läuft.

Bei einem KI-Workshop, den ich im Rockhouse leiten durfte, hast du neulich gemeint, die Studiosprecher-Jobs seien aufgrund der jüngsten Entwicklung deutlich zurückgegangen. Kannst du das kurz erläutern? Wie hat sich der Markt entwickelt?

Wolfgang Schramml: Bis zu diesem Zeitpunkt hatte ich heuer drei Sprachaufnahmen. Im vergleichbaren Zeitraum der letzten Jahre hatte ich im Schnitt schon zwischen zwanzig bis fünfundzwanzig Jobs.

Das heißt, es ist eklatant zurückgegangen?

Wolfgang Schramml: Ja, es ist eklatant und es ist verblüffend, wie schnell es gegangen ist. Die qualitative Entwicklung ist schnell, aber verwunderlicher war für mich, wie schnell es vom Markt akzeptiert wurde.

Wie meinst du das?

Wolfgang Schramml: Na, ich verstehe es bei einem großen Konzern, der weltweit fünfzigtausend Angestellte hat und sich durchrechnet, dass er sich bei der Menge an Inhouse- und Incentive-Videos, die er jährlich macht, ein paar Millionen Euro einsparen kann. Das Ergebnis ist dann halt nicht so gut gesprochen und klingt nicht so gut, aber die Schere geht da schon weit auseinander. Jedes Mal eine Sprecherin oder einen Sprecher und ein Studio anzumieten, kostet halt, selbst wenn man günstig produziert.

Und wo verstehst du es nicht?

Wolfgang Schramml: Bei kleineren Firmen, weil dort das Einsparungspotenzial vergleichsweise gering ist. Ein paar Aufnahmen für die Homepage, da fällt der finanzielle Unterschied nicht so ins Gewicht, dafür habe ich einen besseren Sound, habe es intuitiver und besser gesprochen, und das Video verwende ich dann auch viel länger. Manchmal bis zu zehn Jahre. Da verstehe ich es nicht ganz. Der Rauchfangkehrer mit einem Angestellten, der seinen Anrufbeantworter von KI besprechen lässt, das verstehe ich dann wieder.

Aber die Geschwindigkeit, mit der sich die Dinge weiterentwickeln, ist eine rasante. Die Unterschiede werden geringer.

Wolfgang Schramml: Das stimmt. Jeden Tag kommen Meldungen, was jetzt auf einmal geht. Die Büchse ist offen, und es wird kein Stein auf dem anderen bleiben, weder für Fotografen, noch für Grafiker, Tonstudios, Sprecher und Techniker. Bei Sängerinnen und Sängern sehe ich das noch nicht so problematisch. Die werden eine Spur weniger betroffen sein, weil man bei denen auch die Persönlichkeit hören will.

Bei Sprechern nicht?

Wolfgang Schramml: Doch, auch. Aber das gilt für die absoluten Spitzensprecherinnen und -sprecher, die gefragtesten drei, vier pro Land. Die wird es weniger betreffen, aber die Durchschnittssprecherinnen und -sprecher werden es stark spüren bzw. spüren es jetzt schon.

Setzt du selbst KI ein?

Wolfgang Schramml: Jein. Ich beschäftige mich damit, weil ich weiß, dass es kein Zurück mehr gibt. Teilweise ist es auch sinnvoll. Vor kurzem habe ich einen Kreativitätsworkshop geleitet und wurde danach um ein zusammenfassendes Handout gebeten. Ich hatte nur eine achtzehnseitige Sammlung an Informationen und wegen dringender Aufnahmen eigentlich keine Zeit, also habe ich die KI mit einem Prompt befragt. Ich bin zu großer Perfektionist, um das einfach irgendwie zu machen und dann meinen Namen drunter zu setzen. Das ist für mich oft ein Fluch, für meine Kundinnen und Kunden ein Segen, weil ich oft der Meinung bin, etwas geht noch besser und man sollte es so, wie es jetzt ist, noch nicht rausgeben, sondern noch weiter daran arbeiten.

Nach zehn Sekunden hatte ich eine Zusammenfassung, die mich schlucken ließ. Dafür hätte ich mindestens zwei Stunden gebraucht. Klar: Drei, vier Dinge musst du ausbessern, du musst schon drüberschauen, aber das Ergebnis war echt beeindruckend.

Überraschend gut also?

Wolfgang Schramml: Ja, ich habe wie viele andere immer wieder ein wenig herumgespielt, und mir immer gedacht: Ja, das ist eine nette Spielerei, die Sprachaufnahmen sind ganz gut, aber die humane Art der Betonung ist noch nicht so, wie das wirklich gut ist. Ich kann bei einem Video ja immer auch den Text einblenden. Aber wenn ich ihn sprechen lasse, dann will ich von der Stimme etwas ganz Bestimmtes: Stimmfarbe. Tonlage, Melodie. Und letztlich ist es die Emotion, die ich will. In der Hauptsache will ich Emotion vermitteln. Ja, ich kann mittlerweile die Emotion reinpromten und ich kann mit unterschiedlichen Interfaces unterschiedliche Dinge machen, aber ich habe im Ergebnis trotzdem nicht das, worauf es ankommt. Wenn ich einen Anrufbeantworter habe, der nur die Öffnungszeiten durchgibt, ist das egal. Aber in anderen Fällen ist es nicht egal, weil der Mensch im Normalfall mit Menschen kommunizieren will. Da liegt der Punkt. In gewissen Bereichen, wird das unwiderruflich den Platz einnehmen, in anderen Bereichen nicht. Der Mensch reagiert nämlich auch verstimmt, wenn er das Gefühl hat, hinters Licht geführt worden zu sein.

Aber viele glauben offenkundig, dass es ausreicht, sonst hättest du den Umsatzeinbruch ja nicht, oder? Denkst du, diese Kundinnen und Kunden werden früher oder später einsehen, dass es doch besser ist, auf die menschliche Komponente zu setzen, dass es mit KI also nur bis zu einem gewissen Grad funktioniert und sich die Emotion, die sie transportieren wollen, nur mit menschlicher Stimme transportieren lässt? Kommen sie also zurück oder sind sie unwiederbringlich verloren, weil es letztlich nur ums Geld geht?

Wolfgang Schramml: Das wird sich zeigen. Wenn du dich erinnerst, meinten alle, als MP3s aufkamen, die seien qualitativ einfach schlecht. Jetzt haben sie sich aber durchgesetzt, weil ein MP3 wahnsinnig schlecht sein kann oder so gut, dass du, wenn ich es über die Profi-Anlage hier im Studio abspiele, keinen Unterschied zu einem Vollformat erkennst – je nachdem, welcher Algorithmus verwendet wurde. Es wird in Zukunft ein Qualitätsmerkmal sein, eine echte Sprecherin oder einen echten Sprecher eingesetzt zu haben.

Die Sprecherin oder der Sprecher bekommt von mir Regieanweisungen. Die Kundin oder der Kunde ist vielleicht da. Das Gesprochene wird dann mit einem 5.000-Euro-Mikrofon über einen 3.500-Euro-Pre-Amp und über einen hochwertigen Wandler aufgenommen, dann geschnitten, und am Ende hast du genau das, was du ursprünglich haben wolltest. Über die KI bekomme ich Ähnliches, aber nicht den Sound und die Emotion, letztlich also genau das nicht, worauf es ankommt. Aber: Die Algorithmen werden wöchentlich besser. Es kann schon sein, dass ich irgendwann so gut prompten kann, dass die KI genau weiß, wo sie Tempo rausnehmen muss etc. Aber irgendwann wird es dann halt auch so aufwendig, wenn ich es so betreibe, dass sich die Frage stellt, ob es sich auszahlt. Das Verlockende ist ja momentan die Einsparung. Sobald ich das Personal fürs Prompten ausbilden muss und die Arbeitskraft und mehrere Stunden statt ein paar Minuten braucht, wird es schwierig.

Und je mehr Möglichkeiten ich habe, desto mehr kann sich eine Sache auch zerfransen. Du darfst einer Kundin oder einem Kunden ja auch nicht zehn Varianten eines Spots anbieten. Du bietest zwei, maximal drei Versionen an. Wenn du jederzeit alles verändern kannst, geht es genau in die Richtung, die du eigentlich nicht haben willst. Wo das hinführt, ist relativ offen. Die meisten Leute in der Branche sind aber verblüfft, wie schnell es ging, dass die Leute abwandern, weil es ihnen offenkundig egal ist, dass die durch KI erzielten Ergebnisse nicht so gut klingen, als wenn sie es professionell hätten einsprechen lassen. Damit, dass die Kundinnen und Kunden so schnell akzeptieren, dass die Ergebnisse lauwarm im Vergleich zu dem sind, was professionelle Studios liefern, haben wir nicht gerechnet. Die Fehlannahme war, zu glauben, dass sich Qualität durchsetzen wird. Dass es kommt, wussten wir. Wie schnell es geht, nicht. Und wie schnell der Unterschied akzeptiert wird, auch nicht.

Wie lässt sich der Ausfall kompensieren?

Wolfgang Schramml: Das ist jetzt die Frage, die sich stellt. Ich kriege von Firmen Files zugeschickt, die von KI erstellt wurden, die aber so schlecht klingen, dass ich sie aufpolieren soll. Ja, und dann mache ich mit Plug-Ins aus lauwarmen Sounds welche, die besser sind.

Bei Texten ist es viel schwerer ist, aus einem schlechten einen halbwegs guten zu machen als gleich einen guten zu schreiben. Ist das hier auch so?

Wolfgang Schramml: Ja. Ich kann die Emotionalität nicht verändern. Wenn ich die Sprecherin oder den Sprecher hier bei mir habe, kann ich sie oder ihn bitten, am Ende eines Satzes ein bisschen Tempo rauszunehmen. Bei KI-generierten Files kann nur den Sound verbessern. Ich weiß, wie es generiert wurde, und auch, was ich verbessern kann und was nicht. Im Studio habe ich viel mehr Möglichkeiten. Ich verwende ja auch nicht für jede Person das gleiche Mikro. Durch Vorverstärkung und Wandlung erreiche ich eine Dreidimensionalität. Man hört jeden Speichel. Das kann man auch zu unterdrücken versuchen, aber etwas vom Lebensnahem braucht man.

Wie eine quietschende Gitarrensaite?

Wolfgang Schramml: Genau. Bei vielen Plug-Ins habe ich die Samples dabei, die den Slide suggerieren.  Man hat sich an vieles gewöhnt, an Autotune etwa, man wird sich auch an das gewöhnen. Bei Leuten, die nachkommen und jetzt um die Achtzehn sind, ist das etwas anderes. Die sind es gewohnt.

Lass uns noch über die legalen Voraussetzungen der Verwendung von Stimme durch die KI sprechen.

Wolfgang Schramml: Das ist einfach. Es muss öffentlich gemacht werden, welche Daten eingespeist werden. Eine Sprecherin oder ein Sprecher muss sich dagegen wehren können und falls sie oder er sich nicht wehrt, sondern bereit erklärt, gibt es einen Deal und eine Rechnung. Wenn ich so 500 Sprecherinnen und Sprecher eingepflegt habe, kann ich langsam an einem Large Language Modell basteln. Das Sprachmodell basiert auf den jeweiligen Sprachmelodien und jedes Mal, wenn eine Stimme von der Sprecherin oder dem Sprecher XY verwendet wird, bekommt XY Tantiemen.

Du hast vom wegbrechenden Markt gesprochen. Glaubst du, dass sich durch KI auch neue Märkte erschließen lassen?

Wolfgang Schramml: Es gibt Leute, die haben sich auf Skivideos für Wintersport-Orte und dergleichen spezialisiert, und das in zehn verschiedenen Sprachen. Genau darauf haben sich einige spezialisiert. Ich hatte auch schon solche Anfragen, aber wenn ich höre, wie hoch das Budget ist, muss ich aus Seriositätsgründen ablehnen. Wenn ich etwas auf Koranisch machen soll, brauche ich einen Koreaner, der über die Übersetzung drüberschaut und checkt, ob da ein Hund drin ist. Und mitunter sind die begrabenen Hunde eklatant. Wer haftet für eine Anzüglichkeit, die übersehen wurde?

Ich bin seriöser Produzent, ob ich nun Musik, Werbung oder Film mache. Ich möchte Qualität abliefern und nicht für einen Fehler verantwortlich sein, der sich durch Algorithmen eingeschlichen hat. Jedes Mal, wenn ich in der Vergangenheit eine Native Speakerin oder einen Native Speaker engagiert habe, haben die Ungereimtheiten gefunden – selbst in Sprachen wie Englisch oder Französisch. Da gibt es Dinge, die okay sind, die eine Native Speakerin oder einen Native Speaker aber trotzdem anders sagen würde.

Aber ganz abgesehen davon, kann ich nicht dafür geradestehen, dass das auf Koreanisch oder Rumänisch passt. Auf Instagram siehst du ja auch lauter falsch übersetzte Dinge. Wenn da ein Hund spielt, kommt dabei niemand zu Schaden. Aber bei Produktversprechen ist das schon heikel. Ich kann das schon machen, aber nicht die Garantie dafür übernehmen, dass es richtig gesprochen und richtig übersetzt ist – außer ich habe pro Sprache eine Person, die das kontrolliert. Dann aber interessiert es die Firmen nicht mehr. Das ist das Dilemma. Für mich eröffnen sich theoretisch Märkte, aber ich bin Vollblutmusiker und -produzent. Ich will nicht auf Laptop umsatteln, wo ich dann im Homeoffice mit Algorithmen herumspiele.  Aber es wird sich ein Markt eröffnen für Leute, die im Video- und Audiobereich Profis sind und beurteilen, ob etwas verbesserungsfähig ist. Der Markt ergibt sich für Executive Producers oder Consultants. Es ergeben sich neue Märkte, aber es fragt sich, ob man diese neuen Märkte auch beackern will. Die Frage ist auch die nach dem Verhältnis: Wie viel fällt weg und wie viel kommt dazu? Und ich glaube, dieses Verhältnis ist für Kreative verheerend. Es wird viel mehr wegbrechen als dazukommt.

Es gibt eine Studie der ILO, die behauptet, durch KI würden mehr Jobs entstehen als wegfallen.

Wolfgang Schramml: Als der Drum-Computer aufkam, sorgten sich alle, wer denn dann überhaupt noch Schlagzeuger brauchen würde. Damals gab es vielleicht drei, vier gute Schlagzeuger in Salzburg. Heute gibt es viel, viel mehr. Trotz Rhythmus-Computer. Der hat etwas ersetzt und eine neue Ästhetik begründet, aber die Schlagzeuger sind deshalb nicht ausgestorben.

Es wird auch nicht weniger Gitarristen geben, nur weil ich einen Algorithmus habe. Der Unterschied ist jetzt aber: An der Schwelle, an der wir jetzt stehen bzw. die wir schon überschritten haben, wird es disruptiv. Es wird große Effizienzsteigerungen geben, aber worauf sich die Annahme gründet, es würden mehr Jobs begründet als wegfallen, erschließt sich mir nicht.

Hast du Angst vor den kommenden Entwicklungen?

Wolfgang Schramml: Nein, aber es ist klar, dass sich sehr viel verändern wird. Eine Viertelstunde bevor du kamst, ging eine Band raus. Die Band wird auch in zwei Jahren noch einmal kommen – unabhängig davon, was sich in der KI tut. Die kennen das Studio und kennen mich und haben sich auf die gemeinsame Zusammenarbeit gefreut. Da geht es um das gemeinsame Erfahren. Wir, die Gang gemeinsam im Studio mit Wolfgang, das ist eine Gemeinschaftserfahrung. Ein gemeinsames Erleben und gemeinsames Wachsen.

Vielen Dank für das Gespräch.

Markus Deisenberger

++++

Links:
Sonic Flow