In einer idealen Welt, in der jedermann, jederzeit und überall unendlich schnelles Internet und unbegrenzt große Festplatten hätte, wären Speicherformate wie MP3 für Musik, JPEG für Fotos und MPEG für Filme überflüssig. Denn sie alle sind geschaffen worden, um einen Kompromiss zwischen (Klang/Bild)-Qualität und Platzbedarf (auf dem Datenträger oder beim Senden) zu erzielen. Doch auch vor dem digitalen Zeitalter gab es bereits solche Kompromiss-Formate, zum Beispiel das UKW-Radio.
Vergleich zwischen Äpfeln und Birnen / Apple and pears in front of a white studio background
Hier musste man mit den Bandbreiten-Begrenzungen der Radiowellen-Übertragung zurechtkommen. Streng genommen ist sogar jede Schallaufnahme gegenüber dem Live-Erlebnis verlustbehaftet – auch mit 24 Bit und 192 Kilohertz. Das weiter zu vertiefen, würde hier aber zu weit führen. Zwar ist das Format Audio-CD auch schon von einigen Audiophilen kritisiert worden. Tatsache ist jedoch, dass es sich in den letzten 25 Jahren auf breiter Front als Maß der Dinge durchgesetzt hat. Und auch für diesen Beitrag ist dies mein Standard.
Was sind MP3, AAC, WMA und Co? Codecs. Dabei handelt es sich um ein schönes internationales Wort, das sich aus den englischen Begriffen Encoder und Decoder zusammensetzt. Ins Deutsche könnte man den Begriff vielleicht mit Ver- und Entschlüsseler oder Komprimierer und Dekomprimierer übersetzen. Doch MP3 und Co. lassen sich noch genauer typisieren: Sie sind so genannte „lossy Codecs“, auf deutsch verlustbehaftete Ver-und Entschlüsseler. Um Platz zu sparen gehen bei ihrer Verwendung Klanginformationen verloren,. Und das unterscheidet sie im Wesentlichen von anderen Platzsparern wie „.zip“- „.rar“- oder „.hqx“-Dateien. Diese Datei-Kompressoren packen Daten geschickt, beim Auspacken werden die Dateien aber wieder vollständig rekonstruiert.
MP3, AAC und WMA werden auch „perceptual Codecs“ genannt, denn sie arbeiten mit unserer Wahrnehmung, besser gesagt: Sie nutzen die Schwächen unseres Gehörs, um Daten zu sparen. Aus diesem Grund ist es auch ziemlich sinnlos, den Verlusten in MP3-Dateien mit Audio-Messgeräten zu Leibe zu rücken. Die finden zwar heraus, dass der Codec etwas weglässt, aber das bestreitet ja auch niemand. Ohne Weglassen gäbe es nämlich keine Platzersparnis. Ob der Codec unser Gehör erfolgreich hinters Licht führt, lässt sich nur in einem Hörtest ermitteln.
Der Vollständigkeit halber will ich hier auch „lossless Audio Codecs“, etwa FLAC (Free Lossless Audio Codec) oder Apple Lossless nennen. Diese Codecs versprechen, dass die Kompression zu keinerlei Klangveränderungen führt. Apropos Kompression: Wenn dieser Begriff im Zusammenhang mit Codecs verwendet wird, ist damit die Stauchung der Dateigröße gemeint und nicht die Dynamikbegrenzung von Musik durch Kompressoren oder Limiter.
Die Qualität verlustbehafteter Codecs bemisst sich zunächst einmal an der Bitrate, die in kbps (Kilobit pro Sekunde) angegeben wird. Somit trifft man beim Erstellen einer MP3-Datei schon die wesentlichste Entscheidung: Wähle ich eine geringe Bitrate, um Platz zu sparen? Oder eine höhere für bessere Klangqualität? Um das Zahlenspiel zu verdeutlichen ein Beispiel: Eine Minute Stereomusik im CD-Format (16 Bit, 44,1 kHz) erzeugt eine Datei, die etwa 10 Megabyte groß ist. Das entspricht einem Datendurchsatz von ungefähr 1411 Kilobit pro Sekunde. Typische MP3-Dateien arbeiten mit 128 kbps, reduzieren die Datei also auf weniger als ein Zehntel ihrer ursprünglichen Größe. Zum Vergleich: Lossless Audio Codecs verkleinern einen Song häufig auf 70 bis 80 Prozent der ursprünglichen Größe. Das ist schon ein erheblicher Unterschied.
KONICA MINOLTA DIGITAL CAMERA
Nur zur Info nebenbei: In seltenen Fällen können sogar normale Dateikomprimierer wie „.zip“ und „.rar“ Platzersparnis bei Audiodateien bringen. Zum Beispiel dann, wenn ich die Einzelspuren einer Mehrspur-Produktion an einen Freund schicken möchte. Alle unbespielten Stellen der Spuren (digital Null) werden beim Komprimieren eingespart, sind nach dem Auspacken aber wieder da. Bei normaler Stereo-Musik bringen diese Datei-Komprimierer jedoch so gut wie nichts.
MP3-Dateien müssen aber nicht zwingend mit einer festen Bitrate gestaucht werden. Das Zauberwort in diesem Zusammenhang heißt VBR (variable Bitrate) und ist recht clever: Bei der Analyse schaut der Codec nach, wie komplex die Musik strukturiert ist und passt die Bitrate der einzelnen Zeitabschnitte individuell an. Komplexe Stellen bekommen viele Bits, einfachere weniger. Aufgrund dieser Flexibilität erreicht VBR in der Regel die beste „Klangqualität-zu-Dateigröße-Bilanz“. Bei manchen Programmen lässt sich einstellen, ob die VBR-Kodierung mit hoher oder mittlerer Qualität erfolgen soll, bei anderen stellt man die höchste und niedrigste zu verwendende Bitrate ein. Einziger Nachteil von VBR: Nicht alle MP3-Player können Dateien mit variabler Bitrate abspielen.
Sind WMA und AAC das gleiche wie MP3? Im Prinzip ja, es gibt nur kleine technische Unterschiede. Es würde allerdings den Rahmen dieses Beitrags sprengen, die Differenzen herauszuarbeiten. AAC war als Nachfolger für MP3 gedacht, konnte dieses Ziel aufgrund der starken Verbreitung von MP3 aber nicht erreichen. WMA ist eine Eigenentwicklung von Microsoft und in vielerlei Hinsicht mit den Fraunhofer-Entwicklungen MP3 und AAC vergleichbar. Selbstverständlich lässt sich trefflich darüber streiten, welcher Codec bei welcher Bitrate die besten Ergebnisse bringt.
In der Praxis ist die Entscheidung längst gefallen: MP3 hat mit riesigem Abstand die größte Verbreitung. Seit Online-Musikläden Titel ohne Kopierschutz verkaufen, hat sich auch hier das MP3-Format auf breiter Front durchgesetzt. AAC wird in Apples iTunes Store verwendet – immerhin der Marktführer beim Musikverkauf online. Außerdem ist AAC Teil des MPEG-2-und 4-Standards, wird also auch vielfach als Format für den Filmton verwendet. WMA ist hingegen ein eigener Standard von Microsoft und schon deshalb weit verbreitet, weil der Windows Media Player auf diesen Codec voreingestellt ist. Trotz der nicht gerade unbedeutenden Lobby für AAC und WMA bleibt jedoch MP3 der ungekrönte König beim Nutzer.
Zur qualitativen Einschätzung nur soviel: Es gibt Unterschiede zwischen MP3, WMA und AAC. Ich persönlich halte sie allerdings für minimal. Wenn ich selbst Musik kodiere, wähle ich in aller Regel MP3. So ist sichergestellt, dass jeder Kunde oder Freund die Datei hören kann. Kompatibilität ist eben ein extrem wichtiges Kriterium, in vielen Fällen wichtiger als das allerletzte „Mychen“ Klangqualität, das AAC und WMA mehr bieten können (je nach Bitrate).
Wie funktioniert MP3? Unkomprimierte Audiodateien, die uns in der Regel als WAV- oder AIF-Dateien über den Weg laufen, speichern mehr Informationen als unser Hirn verarbeiten kann. Sind zwei Töne sehr ähnlich, kann es sein, dass unser Gehirn nur einen davon wahrnimmt. Sind die Noten zwar sehr verschieden, aber die eine ist wesentlich lauter als die andere, ist es möglich, dass wir den leiseren Ton nicht hören. Außerdem reagiert das menschliche Gehör nicht auf alle Frequenzen im hörbaren Spektrum (20 Hertz bis 20000 Hertz) gleich empfindlich. Diese Phänomene des Hörens werden Psychoakustik genannt und seit langem erforscht.
A portrait of a matured caucasian man isolated on a white background. He is holding a funnel and putting it to his ear as if he is deaf.
Es gibt also zahlreiche Tabellen und mathematische Modelle, die das menschliche Hören detailliert beschreiben. Beim Encoding einer MP3-Datei wird das eintreffende Audiosignal analysiert und ebenfalls in mathematische Muster umgewandelt. Diese können nun mit den im Encoder gespeicherten psychoakustischen Mustern verglichen werden. Dabei werden alle Daten weggelassen, die nicht dem gespeicherten Muster entsprechen. Über die Bitrate bestimmt die kodierende Person, wie feingliedrig das gespeicherte Muster angewendet wird. Je geringer die Bitrate desto toleranter der Encoder, sprich: desto mehr Daten stuft er als verzichtbar ein.
Das ist zwar ein wenig vereinfacht dargestellt, soll aber an dieser Stelle reichen. Zusätzlich gibt es noch einen zweiten Kompressionsdurchgang, der der traditionellen Datei-Komprimierung (zip und Co.) ähnelt. MP3-Dateien werden in sehr kleinen Zeiteinheiten, Frames genannt, kodiert. Diese Frames können bei manchen Encodern miteinander interagieren: Hat eines noch Reserven und beim nächsten reicht der Speicher für die verarbeitenden Informationen nicht aus, tun sie sich zusammen und bündeln die Kräfte für ein optimales Ergebnis.
Wann sollte ich MP3 benutzen? Das ist natürlich jedem selbst überlassen, aber bestimmte Grenzen lassen sich abstecken: Den von mir selbst produzierten Song, den ich in mühseliger Kleinarbeit fertig gestellt habe, würde ich nicht ausschließlich als MP3-Datei speichern. Möglicherweise reicht mir die MP3-Datei zum Anhören, ein gut aufgelöstes Master (bei mir zum Beispiel 24 Bit, 44,1 kHz) sollte es aber trotzdem geben. Denn nur dieses Master ist die richtige Grundlage für weitere Bearbeitungen (Mastering, Umschnitte oder Format-Konvertierungen). Sinnvoll ist der Einsatz von MP3 an allen Stellen, wo große WAV-Dateien einfach zu unhandlich sind. Also auf dem MP3-Player, beim Versand von Musik per E-Mail, auf einer Website und so weiter. Die wichtige Faustregel lautet: MP3-Encoding ist immer der allerletzte Schritt in der Bearbeitungskette und nur dann sinnvoll, wenn die Dateigröße ein wichtiger Faktor ist.
Womit erzeuge ich MP3? Viele Sequencer-Programme bieten die Möglichkeit, das Arbeitsergebnis als MP3-Datei zu exportieren. Ich selbst arbeite mit Logic und Pro Tools auf dem Mac und diese beiden Programme veranschaulichen wie unterschiedlich sich die MP3-Kodierung in der Praxis anfühlen kann. Logic kann in einem Export-Vorgang gleichzeitig eine WAV-Version des Titels und eine MP3-Version (oder AAC) auf der Festplatte speichern, und zwar in der Regel schneller als in Echtzeit. Für Pro Tools muss die MP3-Export-Funktion extra gekauft werden (für 22 Euro!). Beim Exportvorgang kann die Software leider nur ein File-Format zur Zeit speichern. Außerdem erfolgt der Export in Echtzeit, dauert also immer so lange wie der Titel.
Aber es gibt auch reihenweise andere, kostenfreie Lösungen: Der Windows Media Player und iTunes auf dem Mac als Standard-Musikprogramme auf jedem Rechner können auch MP3-Dateien erzeugen. Es gibt also eigentlich keinen Grund, für diese Funktion extra Geld auszugeben. Wer die zum Teil etwas eigenwillige Datei- und Speicherort-Verwaltung dieser Programme nicht mag, kann zum Beispiel auf das kostenlose Audacity zurückgreifen, dass es für Mac und Windows-PCs im Internet gibt. Das benutzt den LAME-MP3-Codec, den manche als qualitativ besser einschätzen als Fraunhofer-MP3, das im Windows Media Player und in iTunes zum Einsatz kommt. Mehr zur Qualitätsfrage später.
Wie gut ist MP3? Der Praxistest Während ich mich bisher bemüht habe, mich dem Thema MP3 möglichst sachlich zu nähern, wird es im Folgenden subjektiv. Ich habe mich in den vergangenen Jahren oft und sehr intensiv mit dem Thema auseinandergesetzt. Mehrfach habe ich an mehrtägigen Hörtests unter sehr guten akustischen Bedingungen teilgenommen und mich mit anderen Juroren ausgetauscht. Bei diesen Untersuchungen bin ich zu folgenden Ergebnissen gelangt, die ich in Form von Thesen kurz erläutern möchte:
– MP3 hat sich weiterentwickelt: MP3 ist nicht gleich MP3. Es kommt darauf an, wie aktuell die verwendete Codec-Variante ist. Ich kann mich gut daran erinnern, dass ich in den späten neunziger Jahren kaum zwei Sekunden Anspielzeit gebraucht habe, um eine 128er MP3-Datei an ihren Artefakten zu entlarven. Solche Vorurteile schleppen viele Musiker/Produzenten mit sich herum. Ich habe gelernt, dass die Entwickler ihre Codecs kontinuierlich verbessern. Und das gilt nicht nur für MP3, sondern auch für WMA und AAC.
-Zwischen den Codec-Varianten Fraunhofer und LAME gibt es heutzutage keine nennenswerten qualitativen Unterschiede mehr. Jahrelang galt der LAME-MP3-Codec als besonders gelungen, während die Fraunhofer-Variante als etwas schlechter klingend eingestuft wurde. Das mag zeitweise auch so gestimmt haben, in aktuellen Versionen kann ich jedoch keinen signifikanten Unterschied mehr hören. Das Problem ist ein anderes: Während die LAME-Entwickler Versionsnummern vergeben und der Nutzer so leicht erkennen kann, welche Ausbaustufe des Codecs er besitzt, ist es beim Fraunhofer-MP3 undurchsichtiger: Mir ist keine Möglichkeit bekannt, wie sich herausfinden lässt, welche Ausbaustufe des Fraunhofer-Codecs im aktuellen Windows Media Player oder in iTunes steckt. Im Praxistest (Herbst 2009) lieferten beide Programme Ergebnisse, die sich nicht vor LAME verstecken mussten.
– Auf die Variante mit 128 kbps haben Programmierer besonders viel Sorgfalt verwendet. Wie oben erwähnt, konnte ich vor einigen Jahren sparsam komprimierte MP3s mit 128 kbps sofort an ihren klanglichen Fehlern erkennen. Offensichtlich haben die Entwickler sich viel Mühe gegeben, die Ergebnisse bei dieser sehr beliebten Bitrate deutlich zu verbessern. Zur Vorbereitung auf einen Hörtest vor drei Jahren hat mir Professor Thomas Görne von der Hochschule in Detmold einige AES-Unterlagen samt Klangbeispielen zur Verfügung gestellt. „Codecs – what to listen for“ war der Titel für die Audiobeispiele. Dort wurde erklärt, mit welchen Klängen sich lossy Audio-Codecs leicht erntlarven lassen. Kastanietten und die Triangel gelten als sogenannte „Codec-Killer“. Die Klangbeispiele lieferten auch gut hörbare Ergebnisse. Schade nur, dass sich diese Ergebnisse bei der Vorbereitung für den Hörtest nicht einmal bei 128 kbps reproduzieren ließen. Auch die Codec-Killer konnten den aktuellen MP3-Varianten wenig anhaben. Höhere Bitraten wie 192 oder 256 kbps lieferten auch schon vor Jahren sehr ordentliche Ergebnisse. Dass auch bei 128 kbps eine Qualität erreicht wurde, die nicht mehr so leicht vom Original zu unterscheiden war, hat mich damals überrascht.
– Mit auffälligen qualitativen Einschränkungen muss man in folgenden zwei Fällen rechnen: Benutzt man ein betagtes Programm zum Enkodieren, ist es gut möglich, dass Artefakte auftreten – wie oben bereits erläutert. Auch aktuelle Programme kommen jedoch an ihre Grenzen, wenn eine Audiodatei immer wieder neu mit 128 kbps komprimiert wird, obwohl sie schon vorher als MP3 kodiert war. Erstaunlicherweise zeigen die ersten drei Generationen kaum hörbare Einbußen. Ab der vierten Version wird es jedoch deutlich hörbar. Die unerwünschten Nebengeräusche klingen zwar etwas anders als bei alten Codec-Varianten, haben aber das gleiche Ergebnis: Das feinfühlige Ohr ist beleidigt.
MP3 Beispiele zum Downloaden
Da Audiobeispiele im Netz in der Regel immer komprimiert werden, haben wir hier für Euch 2 Beispielpakete zusammen gestellt. Beispiel 1:Drums unkomprimiert und mit niedriger Bitrate (zum Downloaden klicken). Beispiel 2:Piano mit Triangel unkomprimiert und mit niedriger Bitrate (zum Downloaden klicken). Besonders bei der Triangel und der Hihat im ersten Beispiel könnt Ihr gut die Artefakte hören!
FAZIT MP3 ist mittlerweile sehr gut und selbst bei 128 kbps nur noch dann vom Original zu unterscheiden, wenn man unter guten akustischen Bedingungen sehr genau hinhört. Wichtig: Für beste Qualität sollte man ein Programm benutzen, das mit einer möglichst aktuellen Codec-Variante arbeitet. iTunes 8 oder 9 und der Windows Media Player in der Version 10 oder höher reichen völlig aus. Wer gerne mit dem LAME-Codec arbeiten möchte, kann zum Beispiel das kostenlose Audacity verwenden. Auch viele Sequencer bieten eine MP3-Export-Funktion, in einigen Fällen aber nur gegen Aufpreis. Aus eigener Erfahrung kann ich berichten, dass der integrierte MP3-Support in Logic 8 und 9 offensichtlich mit einer aktuellen Codec-Variante arbeitet, die kostenpflichtige MP3-Export-Funktion in Pro Tools 7.4 dagegen nicht ganz auf der Höhe der Zeit ist.
Ich selbst nutze MP3 heutzutage unter anderem so wie früher Audio-Cassetten: im Auto, in der Bahn, für die Hintergrund-Beschallung oder auf dem Notebook. Ich kenne aber auch Musikliebhaber, die ihre umfangreiche Sammlung auf Festplatte kopiert haben und dafür 256 kbps MP3 nutzen. Und Hörfunk-Spots werden schon seit einigen Jahren als MP3-Datei an die Radiosender übermittelt, meist per E-Mail. Viele Sender geben sich in ihren Richtlinien sogar mit 128 kbps zufrieden.Für die Archivierung eigener Produktionen oder für die Aufnahme einzelner Spuren in einem Musikprojekt ist das Format jedoch nicht besonders geeignet (siehe oben). Hier würde Platz an der falschen Stelle gespart.
Sie sehen gerade einen Platzhalterinhalt von Facebook. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Sie sehen gerade einen Platzhalterinhalt von Instagram. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Sie sehen gerade einen Platzhalterinhalt von X. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.