3D Audio für Anfänger – auf in die Sound Matrix

Spatial Audio, 3D Audio und Immersive Audio sind Begriffe, die hast du bestimmt schon einmal gehört. Während die meisten Tontechniker dabei aber nur über Dolby Atmos sprechen, ist das für mich nur ein kleines Puzzlestück der Möglichkeiten. Daher möchte ich mal einen kleinen großen Überblick geben, was da draußen noch so auf uns wartet, vertont zu werden.

(Bildquelle: Shutterstock / WindAwake/SvetaZi)
Inhalte
  1. Was ist 3D Audio – und was nicht
  2. Wie kann man 3D Audio überhaupt hören?
  3. 3D Audio mit Lautsprechern
  4. 3D Audio über Kopfhörer
  5. Die 3D Audio Matrix
  6. Freiheitsgrade, Degrees of Freedom (DoF)
  7. Unterscheidung Lautsprecher und Kopfhörern
  8. Objekt-basiertes Audio
  9. Im-Lokalisation ist kein Feind
  10. 0 DoF – Normalität neu gedacht
  11. Anwendungen mit ihren Vor- und Nachteilen
  12. Benötigte Investitionen für 3D Audio Anfänger
  13. 3DoF: viel gehört, selten gut gemacht
  14. Anwendungen mit Vor- und Nachteilen
  15. Investition für Head-Tracking
  16. 6DoF – die Königsdisziplin im Bereich 3D Audio
  17. Anwendungen für Games Audio
  18. Investition für immersives, interaktives Audio
  19. Fazit
  20. Glossar 3D Audio – die wichtigsten Begriffe

Was ist 3D Audio – und was nicht

3D Audio beschreibt eine Audiotechnologie, die den Klang in einem dreidimensionalen Raum präzise wiedergibt. Im Gegensatz zu traditionellen Stereo- oder Surround-Soundformaten erlaubt es 3D Audio, Klänge nicht nur vorne, hinten, links und rechts, sondern auch über und unter dem Hörer wahrnehmbar zu machen.

Warum könnte das ein bedeutender Fortschritt sein? Nun, die menschliche Hörwahrnehmung ist von Natur aus dreidimensional. Wir erkennen und interpretieren Klänge in unserem Alltag aufgrund ihrer räumlichen Positionierung. Wenn jemand hinter uns steht und spricht, können wir das dank unseres Gehörs erkennen, ohne die Person zu sehen.

Technologisch ist es mittlerweile möglich geworden, diesen räumlichen Klangeindruck auch künstlich nachzubilden. Das ist eine Spielwiese ungeahnter Möglichkeiten!

Wie kann man 3D Audio überhaupt hören?

Einer der Gründe, weshalb 3D-Audio-Technologien nur langsam den Mainstream erreichen, liegt darin, dass es manchmal schwierig sein kann, ein authentisches 3D-Klangerlebnis zu erzeugen. Hierfür gibt es zwei gängige Möglichkeiten: Lautsprecher und Kopfhörer.

3D Audio mit Lautsprechern

Obwohl 5.1 Surround-Sound als gängiges System betrachtet wird, hat es sich ja nicht wirklich im häuslichen Umfeld durchgesetzt. Diese Konfiguration erfordert fünf Lautsprecher, die vorne links, vorne rechts, in der Mitte und hinten links sowie rechts positioniert werden. Ergänzt werden diese durch einen sechsten Lautsprecher in Form eines Subwoofers, der für Bass Frequenzen wie Explosionen oder Effekte sorgt (Daher gern auch LFE genannt, Low Frequency Effects).

Jedoch erfordert 3D Audio noch mehr Lautsprecher, wie zum Beispiel das beliebte Setup 7.1.4 in Tonstudios. Das bedeutet, dass in Studios mindestens zwölf Lautsprecher an Wänden oder Decken installiert werden müssen, um die räumliche Klangwiedergabe zu ermöglichen. Sieben auf der Horizontalen und vier von oben, sowie ein oder auch mal zwei Subwoofer für die Bässe.

Um für den Konsumenten eine komfortablere Option zu bieten, existieren Soundbars. Diese länglichen Lautsprecher werden häufig unter oder vor dem Fernseher platziert und nutzen eine Vielzahl von Lautsprechern, um den Klang in verschiedene Richtungen zu projizieren – nach hinten, zur Seite oder sogar nach oben. Die Soundbars nutzen die Raumreflexion, indem der Schall an Wänden oder Decken reflektiert wird, man. spricht auch von virtuellen Lautsprechern. Allerdings gestaltet sich die Wiedergabe von Klängen, die von hinten kommen sollen, noch sehr herausfordernd. Daher gibt es meist zusätzliche Satelliten Lautsprecher zum Koppeln an die Soundbar zu kaufen. Es kann sich auch ein zusätzlicher Basslautsprecher lohnen.

3D Audio über Kopfhörer

Als Alternative zu den Lautsprechersystemen bieten Kopfhörer eine persönlichere Lösung für 3D Audio. Die weitverbreitete Nutzung ermöglicht eine binaurale Wiedergabe, wobei spezielle Geräte nicht zwingend erforderlich sind (Auch wenn Hersteller euch liebend gerne ein neues Paar verkaufen wollen.).

Die entscheidende Voraussetzung für die Wiedergabe von 3D Audio-Inhalten ist, dass die Inhalte entweder binaural vorliegen oder das Wiedergabegerät in Echtzeit eine Umwandlung auf zwei Kanäle vornimmt, wie es zum Beispiel bei Dolby Atmos geschieht. Dennoch ist zu beachten, dass nicht alle als “3D Audio” beworbenen Inhalte auch tatsächlich ein authentisches 3D-Klangerlebnis bieten. Einige Formate eignen sich besser für bestimmte Genres oder Anwendungen.

Um das optimale Hörerlebnis zu erzielen, empfehle ich Over-Ear-Kopfhörer, die den Klang weiter vom Trommelfell entfernt erzeugen. Kopfhörer mit einem möglichst linearen Frequenzgang verfälschen den Audioinhalt am wenigsten. Eine eingebaute Head-Tracking-Funktion, das bereits in einigen Modellen wie den Airpods Max vorhanden sind, passen das Klangfeld in Echtzeit an die Kopfbewegungen des Hörers an. Das ermöglicht eine Klang-Dimension.

Auf Plattformen wie Apple Music kann man jetzt schon Mischungen in Dolby Atmos mit der dynamischen Kopferfassung hören. Man braucht natürlich noch die passenden Airpods dazu. Doch das Problem daran ist: Keine der Mischungen wurde für Head-Tracking gemischt, sondern Lautsprecher. Daher kam ich auf die Idee, mal eine Übersicht zu schaffen, wie man die verschiedenen Anwendungen, Formate und Wiedergabemedien strukturieren kann. Damit kann 3D Audio auch wirklich Immersion schaffen.

Die 3D Audio Matrix

Zugegeben, es gibt schon einige Artikel für Einsteiger und angeblich “alles, was man wissen muss.” Mich treiben diese aber in den Wahnsinn – aus folgendem Grund: Es wird schön die Geschichte erzählt mit Mono, Stereo, Surround und dem neuen Ding: Dolby Atmos. In meiner Wahrnehmnung des immersiven Audios geht es aber jetzt gerade erst los, mit Audioproduktionen, die man mit dem darunterliegendem Format AC-4 nicht einmal abbilden kann.

Meine 3D Audio Matrix bietet einen umfassenderen Ansatz, der nicht nur berücksichtigt, wo ich Audioobjekte platzieren kann. Sondern auch, ob ich nur nach vorne schauen soll (0DoF), ich meinen Kopf rotieren kann (3DoF), oder mich sogar im Raum bewegen kann (6DoF). DoF steht für “Degrees of Freedom”, also Freiheitsgerade.

Jetzt noch einmal in übersichtlicher: Wo kann ich meinen Sound platzieren?

  • 0D: Mono: Dieses Format bietet lediglich einen einzigen Audiokanal. Es ist nicht möglich, zusätzliche Rauminformationen hinzuzufügen. Der Ton wird einfach von einer einzigen Quelle wiedergegeben.
  • 1D: Stereo: Bei diesem Format werden zwei Kanäle verwendet, um den Ton nach links und rechts zu bewegen. Dies ermöglicht eine rudimentäre räumliche Wahrnehmung. .
  • 2D: Surround: Typischerweise bei Formaten wie 5.1 oder 7.1 kann der Ton nicht nur vorne, sondern auch hinten im Raum platziert werden. Dadurch entsteht eine erweiterte räumliche Klanglandschaft auf einer Ebene.
  • 3D Audio: Hierbei wird der Klang nicht nur horizontal, sondern auch vertikal im Raum bewegt. Dadurch kann man Klänge auch nach oben oder unten wandern lassen.

Bei all diesen Formaten guckt man aber stumpf nach vorne (wie beim Filmen). Bei Musik ist nicht genau definiert, wohin wir schauen, aber eigentlich ist gar keine Interaktion angedacht. Es sind lineare Medien, bei denen man Start drückt und sie sind irgendwann zu Ende. Doch jetzt wird es erst spannend:

Freiheitsgrade, Degrees of Freedom (DoF)

Es gibt nämlich 3D Audio, da ist genau diese Bewegung gewünscht. Ich kann auch schon mal verraten, dass dort auch der Mehrwert von 3D Audio am größten ist, weil man sich auch schnell in 3D-Welten wieder findet. Wenn man also über 3D Audio redet, reden meist alle über das, was ich 0DoF nennen würde. Doch man sollte unterscheiden, was für eine Komplexität man überhaupt hat:

  • 0DoF: Das ist, womit wir eigentlich immer arbeiten: Man sitzt in einem Sweetspot und guckt nach vorne. Eine komplizierte Bezeichnung für das, was wir als Normalzustand kennen.
  • 3DoF: Hier kann man seinen Blick drehen, etwa wie bei 360-Grad-Videos. Dies wird auch als Head-Tracking (Rotation) oder dynamische Kopferfassung bezeichnet.
  • 6DoF: Dieses Konzept ist bereits aus 3D-Spielen bekannt, bei denen sich der Spieler oder die Spielerin zusätzlich durch einen 3D-Raum bewegt (Translation). Dabei wird nicht nur die Blickrichtung verändert, sondern auch die Position im Raum erfasst.

Unterscheidung Lautsprecher und Kopfhörern

Ich bin Fan von Kopfhörern, jeder hat welche zu Hause und kann damit theoretisch in den Genuss von 3D Audio kommen. Zur Erinnerung: Bei Lautsprechern wird eine große Anzahl benötigt oder eine spezielle Soundbar. Vielleicht noch ein paar Gedanken zu dieser Unterscheidung, weil die meisten Tools wie die Dolby Atmos Production Suite immer erst an Lautsprecher und dann an Kopfhörer „denken“:

Im Tonstudio Betrieb gibt es immer mehr Tools, die diesen Klangeindruck simulieren können. Damit kann man quasi den Sound von seiner gewohnten Monitore virtuell mit auf Reisen nehmen. Oder sich akustisch einmal ins Abbey Road Studio setzen, in dem man nur das richtige Plug-in installiert und die Augen zu macht. Das funktioniert im Pro-Audio Bereicht schon erstaunlich gut, ist aber für KonsumentInnen noch nicht so ganz zugänglich.

Wie man sich aber vorstellen kann ist es in der Realität gar nicht so einfach, wie einen Schalter zu drücken auf dem “Binaural” steht und man hat automatisch ein tolles Kino Erlebnis auf dem Ohr. In der Umsetzung hat man wahnsinnig viele Paramater und Probleme den räumlichen Eindruck mal eben von virtuellen Audioobjekten auf zweikanaligen Stereo-Sound umzuwandeln.

Kopfhörer (Bildquelle: Anton Knoblach)

Objekt-basiertes Audio

Das ist aber eigentlich das Prinzip von objekt-basiertem Audio, so nennt sich die Technologie hinter Dolby Atmos (AC-4), Fraunhofers MPEG-H (bzw. Sony 360 Reality Audio) und Auro 3D sei an der Stelle als Vorreiter erwähnt. Idealerweise macht man einen mehrkanaligen Mix, der dann automatisch auf jedem Gerät gut klingt. Egal ob Smartphone, TV, Soundbar oder Kopfhörer, man ist unabhängig von irgendwelchen Audiokänlen. Beim Abspielen werden die Produktionen in Echtzeit für das endsprechende Medium optimiert.

Das ist aber auch einer der Gründe, wieso sich die Verbreitung von Atmos und Co noch nicht so überzeugend auf dem Massenmarkt durchgesetzt hat. Man muss immer gewisse Kompromisse eingehen und am Ende entscheiden die Mischungen, wie gut der Raumklang zu Stande kommt. Es kristallisieren sich aber Szenarien heraus: So hatte ich bei Dolby Atmos Demos in einem Mercedes bei einem Hiphop Song (und das ist gar nicht mein Genre) erstaunlich viel Spaß.

Stand heute bin ich aber noch der Überzeugung, dass es sich lohnt auch wirklich für Kopfhörer zu Mischen und nicht darauf hoffen, dass das alles schon irgendwie OK durch den Renderer klingen wird. Kopfhörer haben nämlich einen Vorteil, den Lautsprecher nicht haben, eine sogenannte Im-Kopf-Lokalisation. Dennoch wird versucht sie zu eliminieren, zu Unrecht wie ich meine.

Im-Lokalisation ist kein Feind

Beim Hören über Kopfhörer wird Mono und Stereo meist im Kopf wahrgenommen. Stereo ermöglicht zwar eine Bewegung des Tons zwischen links und rechts, jedoch fehlt die Möglichkeit, den Klang räumlich vorne, hinten, oben und unten zu differenzieren. Binaurales Stereo löst dieses Problem und man hat das Gefühl die Töne geschehen um einen herum, nicht nur auf Ohren, bzw. im Kopf.

Klingt als kommen wir damit unserem natürlichen Hörerlebnis näher. Denn Lautsprecher können wir nie als Im-Kopf-Lokalisation wahrnehmen, weil sie ja nicht genau auf unseren Ohren sitzen. Dennoch bietet uns dieses Psychoakustische Phänomen einen entscheidenden Vorteil, je komplexer wir uns in der Welt von 3D Audio bewegen.

Klingt alles noch etwas abstrakt? Keine Bange, daher gehen wir jetzt in die Praxis.

0 DoF – Normalität neu gedacht

0 Degrees of Freedom (0DoF) in der Welt des 3D-Audios ist für uns eigentlich recht normal, da diese üblicherweise eine festgelegte Richtung oder Sitzposition für die ZuhörerInnen impliziert. Anders ausgedrückt, bedeutet dies, dass der Hörer in Bezug auf den Klanginhalt keine zusätzlichen Bewegungsfreiheiten hat und in einer festen Position verharrt.

Worauf ich aber vor allem hinauswill: Es ist nicht nur so, dass die Leute sich mit dem Inhalt nicht bewegen können – sie sollen es genau genommen nicht. Hier lautet das Stichwort “Einhüllung”, da es eher darum geht eine immersive Klangkulisse zu gestalten, die die ZuhörerInnen im wahrsten Sinne auf der Couch fesselt.

Anwendungen mit ihren Vor- und Nachteilen

Anwendungen von 0DoF 3D Audio sind in verschiedenen Alltags-Bereichen zu finden, darunter Kino, Musik, Podcasts aber auch bei Live-Beschallung. Beim Film ermöglicht diese Art von 3D Audio eine lineare Audioerfahrung. Der Ton kann räumlich sein, aber die Leute sollen ja gerade nicht von Geräuschen hinter ihnen abgelenkt werden. Ob da jetzt ein Hubschrauber von über einem drüber fliegt, ist nett, ändert aber nichts an der Story. Der Inhalt würde eigentlich auch in Stereo funktionieren, oder Mono. Hier hat der mehrkanalige Ton von der Firma Dolby seinen Ursprung ist auch wenn ich kritisch bin, macht es schon Spaß das Gefühl zu haben “im Film zu sitzen”.

Nun kam jemand auf die Idee diese Audiotechnologie auch für das Thema Musikproduktion zu nutzen. Es wird beworben mit Livesound, Immersion, den Musikern noch näher zu sein. Aber meist bekommen die gemischten Titel eine Räumlichkeit, die nicht jedem Genre guttut. Außerdem geht dabei meist der Druck verloren, den man vom radiotauglichen Stereo sound vermisst.

Legitimer Vorteil ist aber, dass man bei der Mischung weniger Kompromisse eingehen muss. Statt nur Links und Rechts kann man die Objekte nun auch anhand der Y- oder Z-Achse bewegen. Dadurch kann unser Gehirn sie differenzierter Wahrnehmen und muss ggf. weniger mit Tiefenstaffelung und EQs arbeiten.

Nun soll das Ganze auch für Podcasts verwendet werden, aber da rollt es selbst mir die Fußnägel hoch. Typische Gesprächspodcasts sind als Stereo-Mischungen voll in Ordnung. Meist reicht sogar mono. Man kann diesem Audioformat nicht einfach künstlich eine Räumlichkeit hinzufügen und erwarten, dass es dann immersives Audio ist.

Ebenfalls in seiner Findungsphase ist gerade 3D Audio für den Live-Einsatz. Es gibt bereits eine Auswahl an Anbietern, die nun ihre eigene Lösung präsentieren. Wieso sollte man aber überhaupt Töne hinter sich hören, wenn die Bühne vor einem ist? Gar nicht! Es geht im ersten Schritt eher darum die Herausforderungen, um instabile Phantomschallquellen mit mehreren Line Arrays zu lösen. Im zweiten Schritt kann man dann immer noch wild werden und der Live-Betrieb durchaus dazu ein.

Für mich ist also hier bei 0DoF gar nicht so viel Mehrwert zu finden. Die Stärke von objektbasiertem Audio steckt für mich hier v.a. in der Personalisierbarkeit. Wie cool wäre es etwa Fußball zu schauen und den Kommentartor/In stumm schalten zu können, während man von der Stadionatmosphäre in 3D eingehüllt ist? In dieser Technologie sehe ich absolut Potenzial und die Hoffnung, dass MPEG-H hier das Rennen macht, weil der Dolby Atmos Renderer in der Funktionalität stark eingeschränkt ist.

Benötigte Investitionen für 3D Audio Anfänger

Bei der Umsetzung von 0 Degrees of Freedom (0DoF) 3D Audio zeigen sich Unterschiede in den benötigten Investitionen je nach Wiedergabemethode. Für den Einstieg über Kopfhörer ist die Einstiegshürde niedrig. Egal ob Over-Ear, In-Ear, Hauptsache Stereo und je höherwertiger, desto besser. Diese Ohrhörer müssen nicht unbedingt speziell für 3D-Audio entwickelt worden sein. Es gibt auch genug kostenlose Plug-ins wie DearVR Micro, für rein binaurales Arbeiten. Wer sich in mehrkanaliges Audio einarbeiten will, da lauten meine Empfehlungen IEM Ambisonics Plug-in Suite mit der DAW Reaper.

Aber selbst Dolby verlangt nicht mehr zigtausende Euro an Soft- und Hardware. Die Dolby Atmos Production Suite ist für wenige hundert Euro zu erwerben und in Logic mittlerweile standardmäßig implementiert. Sony 360 Reality Audio kostet ähnlich viel, während hier die MPEG-H Authoring Suite zwar nicht für Musik optimiert wurde, aber mehr Funktionalität liefert und sogar kostenlos ist.

Im Gegensatz dazu erfordert die Implementierung von 0DoF 3D Audio über Lautsprecher mehr Hardware und eine sorgfältigere Konfiguration. Für eine präzise Wiedergabe ist die Einrichtung eines akustisch optimierten Raums mit mehreren Lautsprechern, Subwoofer, Bass-Fallen und akustischen Behandlungen notwendig. Mit Interface, Kabeln etc. ist man da schnell bei einer fünfstelligen Summe.

Die Hoffnung der Tontechniker ist meist diese Investition zu tätigen, um dann höhere Preise für ihre Dienstleistung und Studio verlangen zu können. Die Realität ist leider: Man kann sich nicht einfach Lautsprecher an die Decke montieren und erwarten, dass KundInnen dann mit Geld in der Hand auf einen zugeflogen kommen.

3DoF: viel gehört, selten gut gemacht

Bei 3DoF kann der Hörer nicht nur die Richtung des Tons wahrnehmen, sondern auch einen gewissen Grad an Bewegungsfreiheit erleben. Diese Technologie erlaubt es, dass der Hörer seinen Blickwinkel oder seine Position ändern kann, um das Klangerlebnis zu beeinflussen. Die Anwendungen sind meistens aber weiterhin linear mit fixem Start- und Endpunkt.

Anwendungen mit Vor- und Nachteilen

3DoF 3D Audio wird häufig in 360-Grad-Video-Inhalten eingesetzt, wo das Umgucken und Umhören in der Umgebung ausdrücklich erwünscht ist. Hier wird oft auch über Virtual Reality geredet, doch dazu kommen wir erst bei den sechs Freiheitsgraden. Das bedeutet, dass sich die Wiedergabe des Sounds mit der Bewegung des Hörers in Echtzeit anpasst und zusätzliche Immersion und Interaktivität schafft.

Das bringt uns Menschen einen der Vorteile nun Vorne von Hinten zu unterscheiden zu können. Ist ein Objekt z.B. links vor uns, hat es genau die gleiche Lautstärke und Laufzeit, wie wenn es links hinter uns ist. Lediglich unsere Ohrenform kann bei der Entscheidung helfen. Viel effektiver ist aber die leichte Kopfbewegung und unser Gehirn weiß sofort, wo sich welcher Sound im Geschehen befindet.

Kann man das nicht jetzt schon mit Apple Produkten machen? Ja, dafür etwa auf Apple Music gehen und muss auf den Airpods 3D Sound aktivieren. Das riesige Problem: Die Inhalte wurden nicht mit der Intention gemischt, dass sich die Hörerinnen überhaupt umdrehen. Alles soll 3D sein, genau wie bei Lautsprechern. Doch es würde total sinnvoll sein, die Möglichkeit zu haben, Objekte auch head-locked zu machen, denn aktuell kreist einem meist der Sänger, und die Snare aus dem Center sofort um den Kopf. Diese obligatorische Stereo-Spur ist im 360VR Bereich seit Jahren Standard. Im Bereich “immersive Musikproduktion” redet aber niemand drüber.

Laut Dolby und Co soll man brav nach “vorne” gucken. Daher mache ich die Unterscheidung zwischen 0DoF und 3Dof, weil man theoretisch ja auch 5.1 Surround Sound oder Stereo mit Headtracking hören kann. Problem ist aber, dass auch dort klassisch sehr viel in den Center und vorne gemischt wird, während hinten recht wenig passiert. Wir erinnern uns: die Leute sollen sich nicht umdrehen, aber dadurch wird 3D Audio eben recht wenig genutzt.

Das Pendant auf Lautsprecherseite dazu hört man in einem Kuppel-Kino. Meist füllen Sie aber keine Kugel aus, sondern auf Höhenebene nur eine Halbkugel. Außerdem wird auf Horizontalebene meist nicht 360° sondern “nur” 270° abgedeckt. Durch die Bestuhlung kann man sich sowieso nicht nach hinten drehen. Doch spätestens seit der Sphere in Las Vegas bekommt das Thema trotz immenser technischer Anforderungen mehr Aufwind.

Investition für Head-Tracking

Wer sich 360 Videos mit 3D Audio anhören möchte, wird da schon kostenlos auf YouTube und Facebook, oder natürlich meiner Homepage, fündig. Die dazugehörigen Plug-ins wie die FB360 Workstation gab es mal kostenlos, wird aber aktuell nicht mehr unterstützt. Zugegeben, der Hype um die kugelförmigen Videos ist vorbei, hat für mich aber noch absolut seine Daseinsberechtigung.

Viel zu selten wurde das Potenzial richtig genutzt und Dinge getan, die auch als normales 16:9 Video funktioniert hätten. Außerdem macht so ein Erlebnis auf einem Head-Mounted Display erst richtig Spaß. Hier gab es mit der Oculus Go ein sehr erschwingliches Gerät für 200 Euro und nun mit Konkurrenz aus China mit der Pico G3. Solche Geräte werden eben mit 3DoF bezeichnet, weil man seinen Kopf zwar in VR bewegen kann – den Körper aber nicht fortbewegen kann.

(Bildquelle: Anton Knoblach)

Die dynamische Kopferfassung gibt es auch ohne Videoinhalte. Dazu ist dann aber wirklich ein spezielles Paar Kopfhörer oder Hardware nötig, um die Beschleunigung zu erfassen. Apple hat hier wirklich vorbildlich umgesetzt. Man versteht sofort, ob man überhaupt mehrkanaligen Content hört oder nur Stereomischungen mit mehr Räumlichkeit hochgemischt werden. Das Head-Tracking ist cool, aber aus besagten Gründen wird leider nicht die Frage beantwortet: Ist der Inhalt dafür überhaupt geeignet?

6DoF – die Königsdisziplin im Bereich 3D Audio

6 Degrees of Freedom (6DoF): 3D Audio bietet die höchste räumliche Freiheit und Interaktivität im 3D-Audio-Spektrum. Diese Dimension ermöglicht es dem Hörer, sich frei im dreidimensionalen Klangraum zu bewegen und verschiedene Klangperspektiven zu erleben – weg vom Sweetspot.

Innerhalb des 6DoF-Konzepts hat man nicht mehr ein lineares File, das einfach abgespielt wird. Stattdessen liefert man mehrere einzelne Sounds an, die entweder geloopt werden oder mit einer Interaktion ausgelöst werden. Hier findet man sich schnell in Game-Engines wie Unity oder Unreal wieder, die aber auf Audioebene recht rudimentär ausgestattet sind. Daher wird bei solchen Projekten meist eine Middleware wie WWise oder FMOD angebunden.

Anwendungen für Games Audio

Dieser Grad der Freiheit eröffnet neue Komplexitätsstufe für immersives Audio, insbesondere in Virtual-Reality-Anwendungen und interaktiven audiovisuellen Umgebungen. Oder einfach ausgedrückt kennen die meisten das Konzept einfach aus dem Gaming.

Hier ist aber mal wieder der Content zu beachten. Ein zweidimensionales Strategie-Spiel kann von den Vorteilen von immersivem Audio bei weitem nicht so gut profitieren wie ein Egoshooter in einer 3D-Welt. GamerInnen wissen, wie wichtig es ist seinen Gegner nicht nur Rechtzeitig zu sehen, sondern schon vorher zu hören.

Ähnlich ist es bei diesen immersiven Medien wie VR, AR oder wie es neuerdings genannt wird Metaverse bzw. Spatial Computing. Hängen wir uns nicht an den Begrifflichkeiten auf, sondern daran, dass hier die Audioproduktion wesentlich komplexer ist. Man hat ja auch nun wesentlich mehr Parameter, um seinen Sound anzupassen.

Man muss nun etwa einstellen, mit welcher Lautstärke das Audioobjekt leiser wird, wenn ich mich von diesem entferne. In welchem Winkel strahlt es ab, wenn ich mich wegdrehe? Habe ich beispielsweise eine Abschattung (Occlusion), wenn uns eine Mauer trennt?

Investition für immersives, interaktives Audio

Selbst wenn hier meist nur mit Kopfhörern gearbeitet birgt dieses Feld spezifische Kosten und Investitionen. Ein wesentlicher Aspekt ist die Hardware: leistungsfähige Rechner und geeignete Virtual-Reality-Headsets sind unerlässlich. Als Mac-Nutzer tauchten bestimmte Kompatibilitätsprobleme für mich auf, weshalb ich zusätzlich ein Windows-basiertes Systemen fahren muss.

Die Kosten für Virtual-Reality-Brillen sind zwar stark gesunken aber die Technik der HMDs altert auch sehr schnell. Die fortlaufende Aktualisierung von Tools und Software ist Stand heute ebenfalls ein recht lästiger Kostenfaktor.

Weiterhin erfordert die Implementierung von 6DoF 3D Audio in der Regel ein gewisses Verständnis für Programmierung und Entwicklungsarbeit. Investitionen in Fortbildungen und Schulungen sind erforderlich, um das erforderliche Fachwissen als Tonmeister zu erlangen.

Fazit

Insgesamt bietet 3D Audio neues Licht in eine faszinierende Welt akustischer Erlebnisse, die weit über die herkömmlichen Soundformate hinausgeht. Von Mono bis über Dolby Atmos hinaus eröffnet diese Technologie neue Möglichkeiten, die unsere Hörerfahrung in Musik, Heimkino und Gaming revolutionieren können.

Für Einsteiger ist der Zugang über Kopfhörer unkomplizierter und kostengünstiger im Vergleich zu Lautsprechersysteme. Obwohl die Anfangsinvestitionen variieren, ist die Fortbildung in diesem Bereich unerlässlich, um die volle Bandbreite der 3D Audio-Produktion zu erfassen.

Die ständige Weiterentwicklung und Integration von 3D Audio in diverse Bereiche verspricht eine aufregende Zukunft, die gerade erst angefangen hat. Das waren die Basics, also lass mich gerne wissen, wozu du mehr erfahren möchtest

Glossar 3D Audio – die wichtigsten Begriffe

  • 3D Audio ist eine Technologie, die es ermöglicht, ein Audioobjekt nicht nur links und rechts zu platzieren (wie bei Stereo) oder vorne und hinten (wie bei Surround), sondern auch oben und unten. Es gibt dafür die verschiedensten Formate wie Dolby Atmos (AC-4), MPEG-H 3D Audio, Auro 3D und Ambisonics. Aber auch Game-Engines ermöglichen dies formatunabhängig durch das Platzieren von Mono-Sounds in einer virtuellen 3D Szene.
  • 8D Audio wurde in diesem Artikel bewusst weglassen, weil die Bezeichnung verwirrend ist. Es ist einfach ein beliebter Trend auf Social Media Videoplattformen, bei dem die Musik recht stumpf, aber räumlich um einen herumkreist. Funktioniert nur über Kopfhörer, da aber erstaunlich gut. Woher der Name kommt und was das soll, ist genauestens in meinem Artikel erklärt: https://www.vrtonung.de/8d-audio/ Kurz: Mehr als 3D machen keinen Sinn, vermarktet sich aber besser.
  • Objektbasiertes Audio ist in der Kanalzahl unabhängig von der Wiedergabe-Konfiguration. So kann eine Mischung etwa zehn Audio-Objekte haben, diese werden aber erst bei der Wiedergabe auf die entsprechenden Lautsprecher verteilt oder binaural gerendert. Die Vision ist es nur noch eine Mischung zu erstellen, die auf jedem System optimal klingt. Anderes als noch bei Surround-Sound, wo man für 7.1, 5.1 oder 2.0 Stereo dezidierte Downmixes machen musste.
  • Spatial Audio ist für im Grunde einfach die englische Übersetzung von 3D Audio.
  • Immersive Audio wird gerne in der Tonbranche verwendet, meint aber oft nur 3D Audio. Für mich kann aber selbst Stereosound immersive sein, wenn die Produktion mitreißend ist. Man muss verstehen, dass 3D Audio nicht automatisch immersive ist, wenn es eben nicht gut gemacht ist. Der Begriff ist schwammig, aber bitte denkt daran, dass es nicht nur im Musik gehen muss, sondern alle Audio-Produktionen wie Film, Hörspiel etc. gemeint sein können.
  • Dolby Atmos wird gerne als Format bezeichnet ist aber eigentlich eher ein Marketingbegriff. Darunter liegt das Format AC-4, das je nach Anwendung (Kino, Heimkino, Streaming) in einer anderen Kanalzahl vorliegt. Es wird gerne als objekt-basiertes Audio bezeichnet, es ist aber genau genommen hybrid, das es eine Kombination aus Audio-Objekt-Spuren und Kanalbasiertem Audio-Bett in 7.1.2 nutzt.
  • 360 Sound habe ich eigentlich mal den räumlichen Ton (meist Ambisnoics) für 360 Videos genannt. Leider dachte sich dann aber Sony, sie nennen ihr neues Format 360 Audio Reality. Maximal verwirrend, daher wollen wir uns nicht zu sehr an Begrifflichkeiten aufhängen sie ändern sich ständig.
  • Im-Kopf-Lokalisation wurde in diesem Artikel hoffentlich ausreichend beleuchtet. Das Gegenstück dazu ist die Externalisierung. Man trägt z.B. Kopfhörer, hat aber das Gefühl, dass der Ton eben nicht im Kopf sitzt, sondern um einen herum passiert. Über Lautsprecher hat man eigentlich immer Externalsieriung – wir haben ja schließlich keine Lautsprecher auf unseren Ohren, Kopfhörer aber schon.
  • VR, AR, XR, Spatial Computing: Ganz ehrlich, jedes Jahr gibt es einen neuen Begriff für diese immersive Medien. Das Problem ist auch, dass die Grenzen zwischen VR (man ist isoliert und taucht komplett in einer virtuellen Realität) und AR (man ist in der augmentierten Realität, erweitert sich seine Umgebung aber durch virtuelle Inhalte) immer mehr verschwimmen. In Zukunft wird es wohl nur noch eine HMD-Brille geben, mit der man beides machen kann – und das nennt Apple jetzt Spatial Computer.

Über mich: Ich mache ausschließlich Anwendungen im Bereich der immersiven Medien. Das macht mich im deutschsprachigen Raum wohl zu einer der größten Enthusiasten in diesem Bereich, gleichzeitig aber auch zu einem großen Kritiker von diesem 3D-Sound. Mein Videokurs auf https://www.vrtonung.de/ bietet eine Plattform, um fundiertes Wissen und praktische Fähigkeiten zu erlangen Auf meinem Blog findest du bereits etliche Inhalte.

Hot or Not
?
Immersive Audio / 3D Audio

Wie heiß findest Du diesen Artikel?

Kommentieren
Schreibe den ersten Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.
Bonedo YouTube
  • LD Systems Mon15A G3 Review
  • iZotope Ozone 11 Advanced Sound Demo
  • Rupert Neve Designs Master Bus Transformer "MBT" – Quick Demo (no talking)