Die Magie der KI – Thomas Fosters aktuelles Buch über Künstliche Intelligenz in der Musikproduktion

In seinem aktuellen Buch „Künstliche Intelligenz in der Musik- und Audioproduktion“ erklärt der erfolgreiche Musikproduzent Thomas Foster, wie Künstliche Intelligenz bereits heute die Musik- und Audioproduktion revolutioniert und welche kreativen Möglichkeiten sie bietet. Das Buch ist ein Muss für all jene, die sich einen Überblick verschaffen wollen, was bestimmte Tools können und was sie kosten.

Thomas Foster ist erfolgreicher Musikproduzent. Er hat nicht nur Musik für den ORF und RTL Aktuell produziert, sondern auch für das amerikanische Nachrichten Netzwerk News Nation, Red Bull, ARD und CBS Radio. Sein YouTube-Kanal Thomas Foster Musikproduktion, auf dem man u.a. Tutorials für Programme wie FL Studio, Ableton, und Cubase findet, zählt über 70.000 Abonnent:innen.

Dass wir uns am Beginn einer neuen kreativen Revolution befinden, steht für ihn außer Frage. Wen man wie er Musik unter Mithilfe von KI-Tools produziert, fühle es sich so an, sagt er eingangs seines neuen Buches, als ob die geballte Erfahrung von Musikgrößen wie Mozart, John Lennon, Michael Jackson, Prince und Bruno Mars – und noch vielen mehr – in jeden Song mit einfließen würde. Das klingt erst einmal vielversprechend, aber natürlich muss man wissen, wo man diese Expertise findet und wie man sie wofür einsetzt. Und genau dafür hat er dieses Buch geschrieben.

Den Beweis dafür, dass den Unterschied zwischen menschlich erzeugter und mittels künstlicher Intelligenz erzeugter Musik nicht einmal mehr Profis erkennen, hat Foster bereits in der ORF-Doku „Künstliche Musik – Die KI-Revolution im Pop“ hinlänglich erbracht, als dessen Hauptprotagonist er fungierte. Da spielte er der bekannten Sängerin Monika Ballwein einige seiner Produktionen vor, und sie musste erraten, ob der Gesang von echten Menschen oder von KI erzeugt wurde. Zu seiner großen Überraschung lag sie in acht von zehn Fällen falsch.

In seinem Buch geht es Foster nun allerdings weniger um die Sensation der KI-Produktion, sondern um die nüchterne Bewertung bekannter KI-Dienste zur Musikerzeugung wie Suno, Hedra, Udio oder auch Lalals, aber auch unbekannterer wie etwa Mureka.  Foster: „Die Frage, die sich uns in dieser neuen Ära der KI und Musikproduktion stellt, ist nicht, ob KI uns Musiker ersetzen kann. Sondern vielmehr: Wie können wir diese Technologien nutzen, um unsere eigene Kreativität zu erweitern?”

Dass er auch Nischen-Produkten Aufmerksamkeit schenkt, ist dabei nur logisch. Denn wenn der Umgang mit Künstlicher Intelligenz eines lehrt, dann, dass Tools, die heute noch nicht bestimmten Standards genügen, schon morgen revolutionär sein können, oder mit den Worten von Thomas Foster gesprochen: „Ein Update kann alles verändern!“

Dabei dienen die von ihm vorgestellten Tools längst nicht nur der Musik- oder Gesangserzeugung, sondern auch der Konvertierung (von der eigenen in eine bekannte Stimme oder von Stimme in ein Instrument mit Lalals bzw. Musicfy) und der Analyse von Sprachaufnahmen. RX11 von iZotope etwa bietet neue, ungeahnte Möglichkeiten der Audiorestauration.

Aber auch die Trennung von Gesang und Musik – bislang eine äußerst anspruchsvolle Aufgabe – wird durch KI-basierte Tools erheblich vereinfacht. So bietet Software wie u.a. Logic Pro fortschrittliche Funktionen zur Isolierung von Gesangsspuren. Der Traum vieler Musikproduzenten, auf die Einzelspuren eines bestehenden Songs zugreifen zu können, der so alt ist wie die Musikproduktion selbst, wird damit Wirklichkeit. Dass dieses und andere Programme bereits erfolgreich eingesetzt werden, können wir immer wieder an posthum veröffentlichen Aufnahmen (z.B. der Beatles oder auch jüngst von Hansi Lang) nachvollziehen, für die der Gesang aus einer bestehenden Aufnahme extrahiert und mit anderer, zeitgemäßer instrumentaler Begleitung neu abgemischt wurde.

Egal wie man nun zu KI und deren Einsatz steht, ob man sich also der digitalen Produktionsweise verschrieben hat oder lieber dem Analogen treu bleibt, an diversen Tools, die das Produzieren erleichtern, indem sie Störgeräusche aufspüren und minimieren oder konkret die Atemgeräusche einer Sängerin oder eines Sängers oder die Rutschgeräusche auf der Gitarre reduzieren, wird man ohnehin nicht herumkommen. iZotope etwa hat das Plugin Neutron entwickelt, das in jedem Musikprogramm auf jede Spur geladen werden kann, um den Klang dieser Spur zu optimieren und den Gesamtmix zu verbessern.

Foster klopft aber nicht nur die verschiedenen Programme auf ihre Stärken und Schwächen ab, beurteilt den praktischen Nuten jedes einzelnen dieser Dienste (was kann das Tool, was nicht? Wofür eignet es sich besonders gut oder eben weniger?), sondern streicht auch die Möglichkeiten heraus, die eine kombinierte Anwendung ermöglicht.

Zum Beispiel: Jemand nutzt SUNO, eine KI-gestützte Plattform zur Musik Generierung. Das erste Ergebnis wird durch Optimierung der Textpromts so lange angepasst, bis er/sie mit dem Ergebnis zufrieden ist. Anschließend lädt er/sie die sogenannten Stems herunter – die Einzelspuren des Songs, wie Schlagzeug, Bass, restliche Instrumente und Gesang, öffnet Logic Pro und importiert diese Stems, um eigene Gesangsspuren aufzunehmen und die Produktion weiter zu verfeinern. Um die Stimme optimal in den Mix zu integrieren und den Klang zu veredeln, nutzt er/sie sie das Tool Neutron 5 von der Firma iZotope, das mithilfe künstlicher Intelligenz den Gesang analysiert und automatisch bearbeitet, um eine professionelle Qualität zu erreichen. Nachdem der Gesang perfekt klingt, lädt er/sie den fertigen Song auf die Webseite LANDR.com hoch, um das Mastering durchzuführen. LANDR bietet eine KI-gestützte Lösung, um den Gesamtklang des Songs so abzustimmen, dass er auf Plattformen wie Spotify neben anderen aktuellen Produktionen bestens zur Geltung kommt. Müßig zu sagen, dass selbst damit noch nicht das Ende der KI-Unterstützung erreicht ist, weil es auch fürs Auflegen im Club bereits entsprechende Tools gibt, die automatisch nach den besten Übergängen suchen.

Und revolutionäre Tools wie RipX DAW erlauben es Stereo-File, egal ob von Spotify, YouTube oder einer anderen Quelle, direkt in das Programmfenster zu ziehen und dort zu analysieren und zu bearbeiten. Rechtlich sehr bedenklich, aber halt auch revolutionär.

Zusätzlicher Praxisnutzen ergibt sich aus den Video-Tutorials, in denen Foster über die beschreibenden Kapitel hinaus in die konkrete Verwendung des jeweiligen Tools einführt, und zu denen man via QR-Code gelangt. Geeignet ist das Buch damit für Anfänger, aber auch für Fortgeschrittene und Profis. Die Dosis kann man selbst bestimmen. Und der Nutzen beschränkt sich nicht nur auf Musikproduzent:innen. Auch Betreiber:innen von Podcasts lernen, wie sie eine klare und verständliche Tonqualität schaffen, indem sie störende Hintergrundgeräusche vom offenen Fenster oder anderen Quellen eliminieren.

Dass Amazon das Buch als Bestseller eingestuft hat, kommt nicht von ungefähr. Es ist nichts weniger als bahnbrechend, das, was KI heute schon in Sachen Musik bewirkt, alles einmal in gesammelter und wirklich übersichtlicher und nachvollziehbarer Form erklärt zu bekommen.

Markus Deisenberger

++++

Künstliche Intelligenz in der Musik- und Audioproduktion: Mit KI in die Zukunft – Neue Möglichkeiten der Kreativität (Thomas Foster Musikproduktion)
Taschenbuch – 14. Januar 2025

von Kampenwand Verlag (Herausgeber), Thomas Foster (Autor)

++++

Link:
Foster Kent
mica-Interview mit Thomas Foster