Text To Speech-Systeme – eine Gefahr für den Sprecherberuf?

Bei Text To Speech-Systemen geht es zum einen um synthetische Stimmen, die auf Sprachsamples basieren, hier werden noch Sprecher_innen benötigt, die diese Samples einsprechen. Das Pendant im Audio-Musik Bereich sind die sogenannten Sampler, die z.B. einen Violin-Sound aufgrund einzelner vorher aufgenommener Töne reproduzieren. Im Musikbereich hat sich diese Technik durchgesetzt, aber analoge Aufnahmen wurden deshalb nicht verdrängt und haben ihre Berechtigung und Wichtigkeit.

Ich denke, dass ähnliches in der Sprecherwelt passieren wird. Beide Welten werden sich nebeneinander ergänzen, verdrängt wird die analoge Welt nicht. Wir haben aber noch eine weitere technische Ebene, die Erzeugung einer Stimme, die nicht auf Samples zurückgreift, sondern völlig synthetisch aus Berechnungen hervorgeht. Auch dieser Faktor ist zu beachten, denn diese Technik ersetzt dann sogar nach und nach die samplebasierte Technik. Im Audio-Musik-Bereich sind hier die reinen Synthesizer zu nennen, die auf verschiedenste Techniken zurückgreifen (Frequenzmodular-Synthese, substraktive Synthese, Spectral Synthese (modeling) usw. Diese Technik wird auch mit Sicherheit im Bereich der Stimmerzeugung einen wichtigen Faktor einnehmen, denn sie hat einen entscheidenden Vorteil: Ich kann „Stimmungen“ auch in Echtzeit bereitstellen und wechseln. Der Nachteil bei einem Sample ist ja, dass ich diese Stimmung einer Sprachaufnahme „eingefroren“ habe und nicht mehr ändern kann. Das gilt z.B. im Audiobereich als Vergleich für die Geschwindigkeit, wie ich eine Violinsaite anstreiche. Ich brauche viele verschiedene Aufnahmen der gleichen Note, für verschiedene Stimmungen und Nuancen. Im Prinzip „unendlich“ viele um in die analoge Welt einzutauchen. Ähnlich ist es bei einer Sprachaufnahme. Wenn Alexa verschlafen klingen soll, brauche ich eben diese entsprechenden Aufnahmen auch noch. Bei rein synthetisch erzeugten Stimmen ist diese „Stimmung“ nur noch ein weiterer Parameter des Programmablaufes und realisierbar.

Mein Fazit: Es wird sich so entwickeln, wie im Musik-Audio-Bereich, alle Aufnahme-Welten werden nebeneinander existieren.Als Künstler und Hörspiel-Produzent setze ich neben realen Stimmen auch gezielt TTS-Stimmen ein, um genau die Wirkung dieser Stimmen zu bekommen, die diese Stimmen ausstrahlen. Bei einer bisher produzierten Spielzeit von über 10 Std. sind das bisher aber keine 10 Minuten. Tatsächlich entstand aber diese Tage ein Hörspielkapitel um die 5 Min., was ausschließlich mit TTS-Stimmen produziert wurde, wennauch mit hinterlegter Opernmusik. (Plácido Domingo). Ich setze auch (für Youtube) lizenzierte Musik ein, da ich diese Kapitel dann nur auf Youtube veröffentliche (kostenloses Projekt). Das erwähnte Kapitel „Radio Sanremo“ habe ich hier verlinkt:

Der Fehler ist oft, digitale Technik dort einzusetzen, wo es lebendig klingen soll, das ist ein Kampf der m.M.n. nicht gewonnen werden kann, der Trick ist, (leblose) Technik dort einzusetzen, wo sie die Absicht verstärkt, was gesagt werden will. Wenn ich einen statischen 4/4 Beat will, der roboterhaft klingt, kann ich das nur mit Technik, das schafft kein (analoger) Schlagzeuger – auch wenn er noch so gut ist. Die Wirkung von Techno-Musik basiert auf dieser Unlebendigkeit und erhält dadurch ihren Reiz. Zu sehen bei der Formation „Kraftwerk“, die diese Monotonie zum Stilmittel erhoben hat (Düsseldorfer Schule). Klaus Schulze (Berliner Schule) schafft es aber, der Technik eine bizarre Wärme und Lebendigkeit zu verlocken, die im Bereich ihrer begrenzten Möglichkeiten zwar bleibt, aber verzaubert. Für mich schließen sich, wie ich oben anführte, die analogen und digitalen Welten nicht aus. Sie haben beide ihre Stärken und Schwächen.

Wo findest Du später Dein Hörspiel-Kapitel?

Dein Hörspiel-Kapitel mit Deiner Stimme wird ein Teil des Hörspiels Salammbo sein. Salammbo ist die Vertonung des gleichnamigen Romans von mir (Dirk Stabernack).

Der Roman hat eine Grundstruktur, wird aber während der Vertonung weiter geschrieben und ist eine offene Geschichte mit vielen Figuren, vielen Themen. Im Kern geht es um das Thema Geschlecht und wie Geschlecht in der Gesellschaft verhandelt wird, welche immense Wichtigkeit es haben soll, welches Genital Du besitzt.

Als ich im Mai 2020 anfing, Salammbo zu vertonen, traf ich die Entscheidung, dass ich viele Hörer_innen erreichen möchte, dass das Hörspiel Salammbo kostenlos sein soll und das ich für die Verteilung Social Media nutzen möchte.

Alle Links, die Du hier nun findest, werde ich früher oder später nutzen, einige sind noch so gut wie ohne Traffic, was aber nicht heißt, dass dieser sich nicht noch einstellen wird. Ich möchte aber hier aufzeigen, dass die Saat gesät ist und ich an organischem Wachstum arbeite. Das kann nur gut für Dein Ziel sein, auch mit Deinem Namen als Sprecher_in daraus einen Vorteil zu ziehen.

Youtube
„Salammbo“
hier werden alle relevanten Kapitel zum Salammbo-Hörspiel veröffentlicht
„Salammbo kostenloses Hörspiel“
Ersatzaccount + für YT-Kommentare, da im YT-Kanal-Titel mehr Infos stehen

Podcast
Salammbo kostenloses Hörspiel Hörbuch
Spotify
Google Podcast
RadioPublic
Pocket Casts
Overcast
Breaker

Facebook
Carol Rose (Dirk Stabernack)
Produktionsaccount via Messenger
Dirk Stabernack (Carol Rose)
Künstleraccount für FB-Gruppen

Twitter
@Salammbo11

vimeo
Dirk Stabernack

Instagram
carolrose5863

Webseiten
http://salammbowelt.de
für Hörer_innen

http://backstage.salammbowelt.de
für Medien, Mitwirkende, interne

http://apologie.salammbowelt.de
was steht zwischen den Zeilen

http://zitate.salammbowelt.de
Zitate aus Salammbo, z.B. für Twitter

http://stimmige.salammbowelt.de
Finde Deinen Sprecher (diese Seite)