Audiokompression und planbare Kompromisse (Seite 1) - Audiokompression allgemein - AudioHQ

Sie sind nicht angemeldet. Bitte melden Sie sich an oder registrieren Sie sich.


[ Geschlossen ]

AudioHQ » Audiokompression allgemein » Audiokompression und planbare Kompromisse

Seiten 1

Sie müssen sich anmelden oder registrieren, um eine Antwort zu verfassen

RSS Thema Feed

Beiträge [ 12 ]



1 bearbeitet von Frank Bicking (Original: 2003-12-07 03:21)

Thema: Audiokompression und planbare Kompromisse

Dieser Text ist relativ umfangreich geworden und eher für das Ausdrucken vorgesehen.
Für eine Schnellinfo empfiehlt es sich, nur die Zusammenfassung zu lesen, um sich einen Überblick zu verschaffen.


"Audiokompression - Qualitätsdefinitionen und planbare Kompromisse"

0. Einleitung
- Ziel der Audiokompression - effektive Transmission -

1. Archivqualität vs. CD-Qualität
- Historie - CD-Qualität - Red Book - EAC - Secure Mode - Einzeltitel-Rippen -

1.1. Kompromisslos - Lossless Formate
- verlustfrei - populäre Formate - optimierte Pack-Algorithmen - ca. 50-60 % der Originalgröße -

1.2. Kompromisse - Lossy Formate oberhalb der Transparenzgrenze
- psychoakustische Modelle - Transparenz - Verzicht auf bitidentische Reproduktion - Ratio von 1:7 - Entwickler-Presets - populäre Formate - Generationseffekte - Gapless Playback - Presetwahl - Kompatibilität -

1.3. Kompromisse - Lossy Formate unterhalb der Transparenzgrenze
- Sympathiefaktor -  Gleicher Klang bei halber Dateigröße - Light-Formate - SBR-Modus - Kompromissbereitschaft -

1.4. Zusammenfassung

2. Anhang, Anmerkungen und Kommentare



0. Einleitung:

Inzwischen blicken wir auf einige Jahre der Diskussion über die Themen Audiokompression und (Audio)CD-Kopierverfahren zurück. Je nach Sichtweise hat sich sehr viel oder auch sehr wenig getan. Begriffe wie MP3Rippen und Encoder haben sich mittlerweile etabliert und gehören selbst in Haushalten, die kaum Unterhaltungsmedien konsumieren, zum alltäglichen Sprachgebrauch.  Einerseits bewegt sich ein großer Teil der Nutzer auf einem hohen Wissensniveau, nutzt neueste Technik (Software/Hardware), investiert viel Zeit und Geld und hat dementsprechend einen großen Fachinformationsbedarf. Andererseits lassen sich viele Einsteiger von der Industrie für gutes Geld ungenügende Werkzeuge und teilweise inkompatible Hardware verkaufen, ohne ihre Qualitätsansprüche oder das bevorzugte Nutzungsverhalten zu überdenken. Daher gibt es also auch hier weiteren Informationsbedarf, der über die zu oberflächlichen Inhalte der Artikel in der Computer-Presse hinausgeht. Gerade die schon benannten Einsteiger, aber auch "Berufs-Updater" oder potentiell "Formatwechselwillige" brauchen zusätzliche Orientierung.

Hinzu kommt, daß das Thema "Komprimieren" von vielen Mißverständnissen, Halbwahrheiten und  Werbelügen durchsetzt ist. Firmen und Nutzer verwenden sehr oft existierende Fachbegriffe frei nach ihrem eigenen Verständnis und entsprechend verkommen die Bedeutungen zu Marketing-Worthülsen. Für Beurteilungen und Vergleiche genügt aber dieses Halbwissen nicht. Gerade der letztgenannte Punkt führt nämlich oftmals dazu, daß man z.B. immer wieder endlose Diskussionen um simple Phänomene der Audiokompression innerhalb von Newsgroups, Foren und anderen Medien beobachten kann. Aber auch "Fachbeiträge" und Tests aus der Computerpresse für unterschiedlichste Zielgruppen enthalten mitunter  merkwürdige Vergleiche/Empfehlungen und sollten daher dringend ergänzt und aktualisiert werden.

Mit zunehmender Kommerzialisierung der Audiokompression wird dieses "Babylon-Phänomen" gewiß nicht abnehmen. Manche Mythen haben sich sogar schon etabliert. Als Beispiele seien nur die "doppelte Spielzeit"-Diskussion oder die Diskussionen rund um den minderwertigen Xing-, Blade- und iTunes-Klang genannt. Entsprechende Auseinandersetzungen treten immer dann auf, wenn sich die Beteiligten lernresistent verhalten und persönliche Eindrücke und Vorlieben verallgemeinern. Das gilt sowohl für selbsternannte Profis, wie auch für so genannte "Fachjournalisten". Das Ergebnis ist aber letztlich unbefriedigend für alle (Test-) Teilnehmer und Leser, außer, der Diskussionsverlauf gestaltet sich so, wie in diesem Gegenbeispiel. Wo liegen nun die Verständigungsschwierigkeiten und Problemfelder, die Anwender daran hindern, vorhandenes Teilwissen in einem größeren Rahmen einordnen zu können?

Zuerst einmal möchte ich mit einer Definition des Begriffes "Archivqualität" beginnen. Danach sollen die verlustfreien (lossless) Formate näher beleuchtet werden. Zum Schluß möchte ich die populären verlustbehafteten (lossy) Codecs, wie etwa MP3 oder Ogg-Vorbis, besprechen. Es sei darauf hingewiesen, daß die auf AudioHQ empfohlenen , meist quelloffenen, Non-Profit-Programme (OpenSource/Freeware) und dazugehörigen Tutorials es ermöglichen, unsere Aussagen zu überprüfen. Außerdem können sie dazu dienen, Audiodateien für Archivierungszwecke (Backup) zu erstellen. Im Regelfall dürfte die hörbare Qualität weit über der liegen, die mit kommerzieller Software erreichbar ist. In diesem Zusammenhang ist der generelle Verzicht unsererseits erwähnenswert, Software zu empfehlen, die Spionagefunktionen,  Werbetrojaner und Bezahldienste verwendet. Wir stellen uns gegen den Trend, über nicht vordergründig erkennbare Funktionen die Nutzungsgewohnheiten und Vorlieben von Anwendern zu beobachten. Kompromisse im Hinblick auf die Klangqualität werden aufgezeigt und können durch geschickte Planung vermieden oder gar vollständig umgangen werden. Die Schwerpunkte werden absichtlich auf die computerbasierte Archivierung und die Wiedergabe über eine HIFI-Anlage gelegt, weil die Fähigkeiten zur Verwaltung und hochwertigen Wiedergabe bei DVD-Playern, Portables und im HIFI-Bereich meist minderwertig oder schlichtweg gar nicht vorhanden sind. Eine Diskussion um Kopiersperren und zugehörige Lösungsvorschläge findet aus verschiedenen Gründen nicht statt. Es geht im folgenden einzig darum, Privat- bzw. Sicherungskopien für eigene Zwecke zu erstellen.

Im Verlauf dieses Leitartikels werden die Gründe herausgearbeitet, warum nicht nur die Wahl eines bestimmten Audioformates allein, sondern auch die Art der Erstellung wie auch die der Aufbereitung wichtiger für die Gesamtqualität sind. Die von uns aufgeführten Vorschläge sollten bereits in die Planungsphase einfließen und, entsprechend gewichtet, den persönlichen Wünschen und Bedürfnissen angepasst werden.
In allererster Linie geht es im folgenden darum, die Formatwahl zu klären. Fragen zur Planung eines Archivs, zur  Softwarequalität oder zur Datensicherheit sollen zukünftig in weiteren Leitartikeln geklärt werden.

Das Ziel des Ganzen könnte folgendermaßen umrissen werden:

Nicht kopiergesperrte Audio-CDs oder Teile daraus per Software für den Eigenbedarf so zu kopieren, daß sie verlustfrei (oder definiert verlustarm) transformiert, transportiert, vermischt und archiviert werden können.

Es geht im Folgenden zum einen darum, die Inhalte vom Ursprungsmedium zu trennen und auf unterschiedlichsten Datenträgern abspielbar zu machen, und zum anderen, sie bei vertretbarem Aufwand mit Hilfe von verschiedenen Medien zu übertragen bzw. weiterzuverarbeiten. Das geschieht unter Berücksichtigung der jeweiligen Eigenschaften der Ursprungsmedien, der selbsterstellten Medien, der Übertragungswege und der großen Vielfalt  vorhandener Hardware- oder Computersysteme. (Erfolgt dies mit einer möglichst geringen Nominalbitrate, so nennt man das eine "effektive Transmission" (Übertragung) der Inhalte.)

Das Archiv soll mit verschiedenen Hard- und Software-Abspielern wiedergegeben werden können, formatunabhängig funktionieren  und erweiterbar sein. Die Wiedergabe soll PC-basiert erfolgen.  Eine geringe Zugriffszeit und ein Maximum an Such-Komfort sollen diese auszeichnen. Außerdem soll die Präsentation der Inhalte auf einem möglichst hohen Niveau stattfinden, damit der Nachteil der unvermeidlichen Virtualität der Sammlung ausgeglichen wird. Aspekte der Datensicherheit und Schutz vor Datenverlust sollen ebenfalls berücksichtigt werden.

Hier gehts zum Auditorium ...

2 bearbeitet von Lego (Original: 2005-04-17 00:00)

Re: Audiokompression und planbare Kompromisse

1.0 Archiv- vs. CD-Qualität

Es gibt inzwischen eine große Anzahl von Anwendungen im Bereich der Audiokompression und der Digitalen Audio Extraction (DAE). Sie werden unter den Begriffen Multimedia bzw., übergeordnet, Unterhaltung/Entertainment zusammengefaßt. Das praktische Wissen um die Zusammenhänge bei der Nutzung dieser Anwendungen dürfte in Zukunft weiterhin an Bedeutung gewinnen, da die nachwachsenden Musikliebhaber-Generationen einen ans Internet angeschlossenen PC als erstes HIFI-Gerät kennenlernen. Der Sachverhalt der wachsenden Begeisterung für mobile Wiedergabegeräte, P2P-Börsen und das Aufzeichnen von Webradiostreams, welches ähnlich wie das vormalige Mitschneiden von UKW-Radiosendungen auf Musikkassette (MC) funktioniert, sollte diese These stützen.

Die Audio-CD gibt es inzwischen bereits seit etwas mehr als 20 Jahren. Sie ist derzeit der kompatibelste Standard, mit dem sich hochwertig Musikmaterial verbreiten läßt. Sie besteht aus einem Kunststoff-Datenträger, auf dem sich spiralförmig eine PCM-codierte Datenspur von innen nach außen windet. Diese Spur besteht aus aufeinanderfolgenden Datenblöcken, die das eigentliche Nutzsignal enthalten. Der Datenträger besitzt, damit das Abspielgerät jeden einzelnen Titel finden kann, ein Inhaltsverzeichnis (Table of Content  TOC), sowie ein Lead-In und Lead-Out, welche die Außengrenzen der CD anzeigen. Die TOC spielt beim Rippen und bei der Erstellung von Cuesheets eine wichtige Rolle, weshalb sie uns in den entsprechenden Tutorials bzw. im weiteren Verlauf wieder begegnen wird. (Weitere Informationen zu diesem Thema können einem Beitrag von "Spunky" entnommen werden.)
Als Rippen (herausreißen,trennen) bezeichnet man in erster Linie das digitale Auslesen von Audio-Datenträgern (DAE=Digital Audio Extraction) zum Zweck der Archivierung. Die meist sofort nachfolgende Codierung in ein entsprechendes Audioformat mittels eines Encoders wird oftmals im gleichen Atemzug ebenfalls mit diesem Begriff in Zusammenhang gebracht.   

Bei Recherchen in Sachen Archivierung von Audiodatenträgern und zur Verfügung stehenden Qualitätsstufen stößt man immer wieder auf den seitens der Industrie verwendeten Begriff der "CD-Qualität". Er wurde in der Vergangenheit (ca. 1997) vom Fraunhofer-Institut in Bezug auf das MP3-Format in Umlauf gebracht, meint aber erst einmal nur, daß sich das Ergebnis "genauso gut" wie eine CD anhört. Es wurde damals vor allem Wert auf das Marketing mit einer 10fachen Kompressionsratio gelegt, um mit der selbstdefinierten "CD-Qualität" gegen den Konkurrenten Real Media bestehen zu können. Die benannte Kompressionsratio entspricht einer Nominalbitrate von 128 kbps und niedriger. Hochwertiger Klang oder gar Transparenz waren damals zweitrangig, außerdem wurde der bekanntermaßen maßstabsetzende Klang der CD durch diese plakative Reklame natürlich zweckentfremdet. So verwundert es auch kaum, daß im Rahmen der Microsoft-Reklame später mit WMA diese "CD-Qualität" sogar schon bei 64 kbps erreichbar sein sollte.(Näheres zum historischen Werdegang kann man hier nachlesen.)

Wer mehr Klangqualität als die bei 128 oder 64 kbps gebotene erreichen möchte, muß sich nach einer höheren Qualitätsstufe umsehen. Über kurz oder lang dürfte er dann auf den von uns ins Spiel gebrachten Begriff der Archivqualität stoßen. (Inzwischen bewegt sich der allgemeine Trend bei den Audiophilen schon in Richtung verlustfrei arbeitender Formate (Ratio 1:2), welche die höchstmögliche Klangqualität sichern. Entsprechende Anwendungen aus der Free-, Open Source-, wie auch der kommerziellen Software-Szene und zunehmende Festplattenkapazitäten machen es möglich.)

Will man "echte" CD-Qualität, um eine hochwertige Wiedergabe von Sicherungskopien im Vergleich zum Original-Datenträger zu erreichen, so bedarf es übrigens keiner Audiokompression. Die CDDA ist seit Anfang der 80er Jahre durch den Red-Book Standard von Phillips/Sony definiert. Man kann die CDDA einfach per "Image mit Cuesheet" im "Secure Mode" mit EAC oder mit den Plextools rippen. Die so gewonnenen Abbilder einer CDDA können danach sofort wieder per EAC oder per Plextools als CD-R gebrannt werden. (Siehe auch hier.)
"Images mit Cuesheet" sind im übrigen mit Foobar2000 und Winamp jederzeit direkt abspielbar. Hier haben wir auch den Hauptunterschied zu den ebenfalls verbreiteten Images der Klon- und Brennprogramme, deren Abbilder der CD nicht direkt abspielbar sind . Vorraussetzung für die bitgenaue Reproduktion sind eine Offsetkorrektur des Leselaufwerks und des Brenners. Dieses Verfahren ist vor allem dann ideal, wenn bei kompletten Alben der Schwerpunkt auf die nachfolgende Erstellung von CD-R gelegt wird. Angemerkt sei, daß Klonprogramme über keinen Secure Mode verfügen, weshalb die entstehende Qualität vollständig von den Fähigkeiten des eingesetzten Lese-Laufwerks abhängt.

Wenn man Einzel-Dateien extrahieren möchte ist eine andere Vorgehensweise nötig. Sie können z.B. per EAC gerippt werden, was wohl die Mehrzahl der EAC-Nutzer tun dürfte. WAV-Dateien und das dazugehörige Cuesheet ergeben eine perfekte 1:1 Kopie der CDDA. Cuesheets sind einfache Text-Dateien, die Brennanweisungen und entsprechende Kommentierungen im formatierten Klartext enthalten. Es lassen sich auch später noch verlustbehaftete Kopien in unterschiedlichen Formaten und Qualitäten erstellen. Sie dienen, wie eine Original-CD auch, als Quelle für das Encodieren und Brennen auf CD-R. Eigene Arrangements, Nachbearbeitungen und Mixes sind ebenfalls möglich und gängige Praxis. A.W.n. sind diese Gesichtspunkte auch die Hauptmotivation für die Anschaffung eines CD-Brenners.)

Die vorliegenden Dateien sind noch unkomprimiert und verhältnismäßig groß. Es handelt sich um Dateien im WAV-Format, die eine konstante Bitrate von 1411 kbps bei 16 Bit/44.100 Hz/Stereo besitzen. Eine Minute Musik entspricht in etwa 10 MB, bzw. ein Album ca. 500-700 MB.

Hier gehts zum Auditorium ...

3 bearbeitet von DAU (Original: 2005-04-17 00:01)

Re: Audiokompression und planbare Kompromisse

1.1. Kompromisslos - Lossless Formate

Wenn ausreichend Festplattenplatz vorhanden ist, kann man die verlustfrei (lossless) arbeitenden Encoder nutzen, um Audiosignale um einen gehörigen Prozentsatz reduziert neuzuverpacken. Für das taggen der Dateien stehen hier im übrigen auch ausgereifte Funktionen zur Verfügung. Diese Form der Audiokompression bietet sich insbesondere dann an, wenn die Audiofiles nochmals mit Editoren, Softwaremixern oder Effekten möglichst verlustarm nachbearbeitet werden sollen. Nach entsprechendem Rippen und entsprechender Wandlung kommen weitere digitale Medien wie etwa DVD/DVD-A, Audio-DVD, Mixes oder Bearbeitungen aus dem Editor/MIDI/Sequenzer dafür ebenfalls in Frage. Man sollte diese Kompressionsform außerdem unbedingt nutzen, wenn man den langen Rattenschwanz an Problemen vermeiden möchte, der mit der verlustbehafteten Variante auf den Nutzer zukommt. Folgende Beispiele mögen das etwas verdeutlichen: Zum einen denke ich da an die Problematik der lästigen und zeitraubenden Encodierung mit zum Teil unterschiedlich verfügbaren Parametern bei verschiedenen Encoderversionen, zum anderen an das Problem der Auswahl eines geeigneten Tagging-Standards.

Die von uns vorgestellten Lossless Formate arbeiten mit Pack-Algorithmen, die speziell für Audiodaten optimiert wurden. Sie verringern per Prediction die effektiv benötigte Datenmenge auf ca. 50-60% der Originalgröße. Ein durchschnittliches Musikalbum mit 50 min. lässt sich von ca. 500 MB auf einen Platzverbrauch von ca. 230-350 MB verkleinern. Als Anhaltswert ergeben sich 3 Lossless-Alben pro GB. Die neueren Lossless-Encoder unterscheiden sich in ihrer Performanz kaum, weshalb vor allem Gesichtspunkte wie Bedienung, Tagging und andere Kriterien bei einer entsprechenden Bewertung herangezogen werden sollten. Alle neueren Lossless-Encoder sind außerdem schneller als z.B. der LAME- oder Vorbis-Encoder. Lossless besitzt daher also den Vorteil der Zeitersparnis beim Erstellen umfangreicher Sammlungen. Übrigens ist es auch möglich, innerhalb eines Lossless-Archivs jedes Album nachträglich durch eine Lossy-Kopie zu ersetzen, um Speicherplatz freigeben zu können. Eine bitidentische Reproduktion steht immer zur Verfügung. Daher kann man dann auch ohne Probleme nachträglich von einem Lossless-Format zum anderen verlustfrei wechseln. 

Populär sind folgende Formate

Wem diese Platzersparnis noch nicht reichen sollte, der kann mit den verlustbehafteten Formaten (Lossy) noch einen Schritt weitergehen.

Hier gehts zum Auditorium ...

4 bearbeitet von DAU (Original: 2005-04-17 00:02)

Re: Audiokompression und planbare Kompromisse

1.2. Kompromisse - Lossy Formate oberhalb der Transparenzgrenze

Bei verlustbehafteter Codierung werden zusätzlich zu den Packmethoden Erkenntnisse der Psychoakustik benutzt, um einen reduzierten Platzverbrauch über eine möglichst niedrige Nominalbitrate herzustellen. Sie nutzt hierfür die Ergebnisse mehrjähriger Forschung und unzähliger Hörtests, um mit Hilfe psychoakustischer Modelle das Signal von Inhalten zu befreien, die, statistisch idealisiert, vom Hörsinn des Menschen nicht wahrgenommen werden können. Ziel aller verlustbehafteten Komprimierer ist letztendlich die effektive Transmission. Effektiv im Sinne möglichst kleiner Bitraten bei einem Maximum an möglicher Übertragungsqualität. Die Klangqualität wird hierbei in mehreren Stufen anhand der Anzahl der auftretenden Kompressionsartefakte von "Imperceptible" bis "Very Annoying", also von "unhörbar" bis "extrem störend", eingestuft . Auf eine bitidentische Reproduktion muß allerdings bei Lossy verzichtet werden. Hier kommt als Gradmesser für die Qualität die Eigenschaft der Transparenz ins Spiel.  Transparenz ist die Umschreibung für eine Klangqualität, bei der idealisiert das Gehör keine Unterschiede zum Original wahrnehmen kann. Einmal herausgerechnete Daten und Inhalte können nicht wiederhergestellt werden. Durch den Encodierungsprozess hinzugekommene Artefakte können ebenfalls nicht wieder entfernt werden. Beim Decodieren werden die Lossy Dateien lediglich aus dem entsprechenden Format ins brennerkompatible WAV-Format umgeschrieben, der hörbare Inhalt bleibt aber identisch.

Erklärtes Ziel aller Entwickler von verlustbehafteten Formaten ist es, erst einmal generell Transparenz zu erreichen. Darüber hinaus gehen alle Optimierungen in Richtung einer möglichst niedrigen Nominalbitrate. Transparent codierende Encoder erreichen ungefähr eine Verringerung des Datenaufkommens auf eine Ratio von 1:7. Das entspricht nominal 200 kbps VBR oder ca. 71-75 MB für ein 50 min. Album, entsprechend 12 Alben pro GB. Wir empfehlen selbstverständlich die optimierten Einstellungen der jeweiligen Codec-Entwickler und die fortschrittlicheren variablen Bitraten (VBR), um diese Transparenz zu gewährleisten. Dies ist sehr komfortabel, weil es dem Encoder überlassen bleibt, unter Verwendung der Entwickler-Presets die optimale Bitverteilung passend zum Eingangssignal bei geringem Platzverbrauch zu finden. Im Ergebnis stoßen wir auf fast keine Problemsamples, störenden Artefakte, Preechos und Verzerrungen. Insbesondere der Musepack-Codec wird für sein psychoakustisches Modell oft von Fachleuten als Referenz bezeichnet und von unserer Seite als Lossy-Archivformat empfohlen. Die einzelnen Lossy Formate werden hier ausführlich erklärt, weshalb ich an dieser Stelle auf generelle Vor- und Nachteile einzelner Formate nicht nochmals näher eingehen möchte.

Populär sind die folgenden Lossy Formate:

Firmenformate:

Archivqualität ist gewährleistet, solange bewußt transparent von einer Original-CD gerippt und encodiert wird. Diese Audiodateien sollten nicht als Quelle für das Erstellen weiterer verlustbehafteter Kopien mittels Transcodieren/Reencodieren dienen, da Generationseffekte auftreten. Allenfalls in MP3-Flash und anderen portablen Geräten sollten diese transcodierten Dateien verwendet werden. Generationseffekte sind vergleichbar mit der zunehmenden hörbaren Verschlechterung einer Musikkassettenkopie, wenn man sie von einer Kopie anstatt dem CD-Original erstellt, analog zu den sichtbaren Verschlechterungen beim mehrfachem Fotokopieren.

Einschränkungen in der Funktionalität erlebt der Nutzer derzeit nur beim verbreiteten MP3, welches Gapless Playback ausschließlich innerhalb von Foobar2000 in Kombination mit LAME-encodierten Dateien unterstützt. Benutzt man andere Software, so wird beim Titelwechsel ein technisch bedingter störender mehrsekündiger Aussetzer produziert. Dieser Mangel wird hörbar bei Live-CDs, Mixes oder Klassikaufnahmen und kann beim Abspielen mit anderen Software- oderHardwareplayern nur durch Manipulationen wie Crossfading (Überblendung) oder Buffering (Pufferung) kaschiert werden. Beim Brennen auf CD-R tritt er jedoch wieder zu Tage. Nachfolgend im Originalton das Statement eines Herstellers zu seiner "Lösung" dieses Problems, welche er auch noch schlichtweg frech als Feature verkauft:

Homogene Übergänge: iTunes überblendet die Musik, um homogene Übergänge zwischen den einzelnen Songs zu erreichen, und passt die Lautstärke der Songs für eine konsistente Wiedergabe an.

Der in iTunes integrierte Überblender ersetzt keineswegs funktionierendes Gapless Playback, denn die von den Musikern bei Konzeptalben eingefügten Übergänge werden durch Crossfading vollständig entstellt. Als populäre Beispiele mögen diverse Pink Floyd-Alben dienen. iTunes AAC und WMA haben ebenfalls wie das angesprochene MP3-Format dieses Problem. Nur Ogg-Vorbis und Musepack ermöglichen derzeit ein durchgehendes Gapless Playback. Die entsprechenden Mängel werden m.E. in den Postings von Frank Klemm recht gut zusammengefasst. Generell sind alle populären Formate zueinander inkompatibel. Dies bedeutet, daß ein MP3-Hardwaredecoder keine Vorbis-Dateien abspielen kann und umgekehrt. Ein Musepack-Encoder kann demnach also auch keine MP3-Dateien erstellen.

Wenn man die öffentlich zugänglichen Diskussionen um die Formate verfolgt, kann man feststellen, daß der Entwicklungshöhepunkt von MP3 mit den Encodern des LAME-Projektes (bei gleichzeitiger millionenfacher Nutzung eines ausgereiften und kostenlos erhältlichen Produktes) längst überschritten ist. Der seitens der Industrie gehypte Nachfolger Mp4/AAC hinkt mit erheblichen Entwicklungsrückständen und Defiziten den Mitbewerbern hinterher. AAC wird erst in einigen Jahren das zweifelsohne vorhandene Potential ausschöpfen. Das Musepack-Format ist seit Jahren technologisch führend. Das Ogg-Vorbis Format empfiehlt sich als Allrounder für die Zukunft und bietet bereits Hardware-Unterstützung. Nimmt man zusätzlich zur Transparenz die Vermeidung deutlich hörbarer Pausen bei Titelübergängen und flexibles Tagging als Beurteilungskriterien für eineArchiv-Qualität in die Liste auf, so bleiben derzeit nur noch Ogg-Vorbis, LAME-mp3, Musepack und Nero AAC übrig. Da aktuell nur ein PC die genannten Merkmale nutzen kann, empfehlen wir die rechnerbasierte Archivierung.

Will man mit Lossy Formaten Archive aufbauen, so genügt es schon, folgende Minimal-Presets zu beachten:

  • Musepack (.mpc) --quality 5

  • LAME (.mp3) --alt-preset standard

  • Ogg Vorbis (.ogg) -q 6

(Siehe auch hier.)

Presets oberhalb dieser Grenzen führen nicht zwingend zu hörbaren Verbesserungen und sind der Kategorie Platzverschwendung zuzurechnen. Möglicherweise könnte man die Hirntot- und Extreme-Presets sogar abschaffen. Sie stiften Verwirrung und führen die eigentliche Daseinsberechtigung von Lossy (nämlich effektive Transmission und Platzersparnis) ad absurdum. Sie werden unreflektiert von Nutzern verwendet, die glauben, "mehr bringt mehr", ohne sich wirklich der Gründe für genau diese Presetwahl bewußt zu sein.

Wenn ein Format mit einer bestimmten Art von Musik oder Samples Probleme hat, dürften sich i.d.R. dementsprechende Fehler meist auch bei der Nutzung höherer Encoder-Presets bemerkbar machen. Es genügt nicht, einfach nominal + 40 bis 80 kbps per höherer Preset-Einstellungen zur Verfügung zu stellen. In solchen Fällen sollte man eher überlegen, ob nicht einfach die Wahl eines anderen Lossy Codecs die bessere Alternative darstellen könnte, weil dort keine oder weniger Probleme als beim ursprünglich favorisierten auftreten. Entsprechend den Ergebnissen der mir aktuell bekannten Hör- und Vergleichstests habe ich jeweils die Minimalqualitäten im Artikel angegeben, die meist identisch zu den Standard-Presets sind und zu Archivqualität führen. Sie geben den aktuellen Stand Januar 2005 wieder. Die oft geführten Diskussionen um den Nutzen von Presets oberhalb dieser empfohlenen Einstellungen erübrigen sich unserer Ansicht nach.

Für Ergebnisse unterhalb der Transparenzgrenze mittels anderer und exakterer Einstellungen des jeweiligen Encoders gibt es allerdings durchaus Gründe, um z.B. den Anforderungen einer von der Industrie aufgezwungenen Kompatibilität mit Billig-Hardware (CBR-Presets) oder einer bestimmten Dateigröße (ABR-Presets) für portable Player (unter hörbaren Verlusten) entsprechen zu können.

Hier gehts zum Auditorium ...

5 bearbeitet von Frank Bicking (Original: 2005-04-17 00:02)

Re: Audiokompression und planbare Kompromisse

1.3. Kompromisse - Lossy Formate unterhalb der Transparenzgrenze

Unterhalb der mit Blindhörtests feststellbaren Transparenzgrenze verschwimmt die Gegenüberstellung verschiedener Formate in Subjektivität und persönlichen Vorlieben. Jeder kann sich sein Wunschformat aussuchen. Vor- und Nachteile lassen sich argumentativ so hinbiegen, wie man es denn möchte.  Irgendwie überzeugend ist jede Argumentationskette, wobei hier vor allem der Sympathiefaktor ein recht wichtiges Entscheidungskriterium zu sein scheint. Lizenz- und patentrechtliche Aspekte mögen ebenfalls eine Rolle spielen. (Letztgenannte sind übrigens auch nicht ganz unwichtig, wenn Entwickler ihre Software quelloffen (Open-Source) oder als Freeware einer Wissensallmende zur Verfügung stellen möchten.)

Wenn man in öffentlich zugängliche Diskussionen diese subjektiven Sympathiefaktoren herausfiltert, dann gibt es kein Kriterium, mittels dessen man Formate unterhalb der Transparenz differenzieren kann.

  1. Die resultierenden Dateigrößen unterscheiden sich nur minimal.

  2. Die Funktionalität aller Formate ist nahezu identisch.

  3. Klanglich liegen fast alle Formate sehr nahe beieinander, so man vergleichbare Qualitätsstufen (Bitraten) verwendet.

  4. Generell bietet MP3 die größte Hardwaredecoder-Kompatibilität und wird derzeit breit von Hardwareherstellern unterstützt. Diese Unterstützung ist zwar zu oft minderwertig implementiert und beschränkt sich auf reines Wiedergeben, aber wenigstens ist sie vorhanden. Aktuell gibt es noch keine wirklich zufriedenstellende HIFI-Lösungen (Hardware), die Gapless Playback, flexibles Tagging und durchgehende VBR-Kompatibilität garantieren.

  5. Hardware-Unterstützung für Ogg-Vorbis ist ebenfalls erhältlich und von durchgängig hoher Qualität, aber nicht im Billig-Segment vertreten, da es sich um Produkte handelt, welche ohnehin nur von qualitätsbewußten Käufern erworben werden.

  6. Generell bietet Musepack die höchste Gesamtqualität bei computerbasierter Wiedergabe. Erst recht, wenn man flexibles Tagging und Gapless Playback als Qualitätsmerkmal hinzunimmt.

  7. Zukünftig wird sich das Thema "Hardwareunterstützung" komplett erledigen, weil die Miniatur-PCs, Tablet-PCs, PIM und Handhelds die mobile Wiedergabe übernehmen werden. Dies wird möglich, weil bei dieser Gerätekategorie die Leistungsfähigkeit sehr schnell in den 500 Mhz-Bereich ausgeweitet wurde. Link

Mitunter behaupten einige nimmermüde Journalisten und Firmen, daß "gleicher Klang bei halber Dateigröße" oder "doppelte Spielzeit bei gleichem Klang" oder ähnliches möglich seien. Werbeversprechen dieser Art zeugen von ungenügender Kenntnis kaum veränderbarer Zusammenhänge oder einem gehörigen Maß an Ignoranz zugunsten unseriösen Marketings, weshalb man Mengenangaben für die Aufnahmekapazität von portablen mp3-Geräten auch grundsätzlich mißtrauen sollte.  "Doppelte Spielzeit" ist physikalisch unmöglich und beruht auf einem Missverständnis der verlustbehafteten Audiokompression und dem unzulässigen Umkehrschluß, daß bei sinkenden Bitraten unbegrenzt hörbar die hohe Qualität beibehalten werden könne. Defacto führen gleiche Bitraten unabhängig vom verwendeten Format zu ähnlichen Dateigrößen. Entsprechend kann nur durch Reduzierung der Bitrate (zB -25 %) ein nennenswerter Einfluß auf die resultierende Dateigröße genommen werden, zumal die ohnehin schon beachtlichen Leistungen der gängigen Formate sich sehr ähneln. Ein Formatwechsel unter dieser Prämisse bleibt deshalb ergebnislos, wenn er nur einer kleineren Dateigröße dienen soll. Als Resultat könnten dann statt 10 Titeln 11-12 Titel auf dem selben Raum gespeichert werden, allerdings mit dem erhöhten Risiko hörbarer Kompressionsartefakte.

Die aktuell erhältlichen Formate sind aber bereits allesamt so optimiert, daß kaum Spielräume verbleiben, um die Bitraten abzusenken. Mit steigender Bitrate wird die Mehrzahl der Formate mit Ausnahme der Problemsamples bei gewöhnlicher Musik zwischen nominal 160 und 200 kbps transparent. Bei sinkender Bitrate steigt das Risiko, unterhalb von 200 kbps die meist für die Archivierung erwünschte Transparenz zu verlieren. Unterhalb 160 kbps nehmen Artefakte, Pre-Echos und Verzerrungen bei den uns bekannten Formaten exponentiell zu und sind schon allein aufgrund ihrer Anzahl hörbar, sodaß man kaum noch von Musikgenuss bei der Wiedergabe auf einer gewöhnlichen HIFI-Anlage sprechen kann. Eine Ausnahme stellt Musepack dar, welches selbst bei Q4 noch eine hohe Performanz bietet. Erstaunlicherweise gewinnt es Hörtests bei gewöhnlicher Musik selbst im extrem kritischen Bereich zwischen 128-160 kb/s und deklassiert die Mitbewerber. Diese Fähigkeit sollte allerdings im Einzelfall mit dem gewünschten Album überprüft werden. Eine solche Einzelfall-Prüfung kann man sich aber auch sparen und unter Verwendung des nächsthöheren Q5 (-standard) Presets Transparenz erreichen.

Bei transparent encodierten Dateien unterschiedlicher Formate ist keine nachvollziehbare Unterscheidung möglich. Es ist demnach egal, ob ein Anwender ein Album in Lame MP3, Ogg-Vorbis oder Musepack erstellt. Deshalb genügt auch das Lame-MP3 Format den meisten Anforderungen an Archivqualität. Außerdem besteht für den Nutzer keinerlei Update-Zwang, solange nicht in den nächsten Jahren sämtliche mp3-fähigen Geräte gegen aac-fähige ausgetauscht werden. Letztlich bleibt aber bei Lossy immer eine Restunsicherheit, ob die hörbare Qualität der Audiodateien wirklich identisch mit der des Quelldatenträgers ist.

Glücklicherweise werden kleine Dateigrößen nur für Anwendungen benötigt, bei denen es nicht auf eine Transparenz ankommt oder bei denen aufgrund der Wiedergabebedingungen bereits bei nominal 128 oder 96 kb/s selbige erzielt wird, wie etwa bei MP3abspielenden Handys, USB-Sticks und Ghettoblastern. Entsprechend kann hier der Konsument z.B. ein 128 VBR oder 96 VBR Preset verwenden, wenn eine möglichst große Abspieldauer gewünscht wird. Für diese Geräteklasse genügt die von der Industrie definierte "CD-Qualität" also völlig, für HiFi hingegen ist sie indiskutabel.

Unterhalb nominal 128 kbps/stereo gibt es noch die "Light-Formate" AACplus, MP3Pro und Vorbis (q0/q1). Sie stellen optimierte Sonderfälle dar und sind für den Einsatz auf Handys, WebRadios, MP3-Portables wie auch das Netzwerk-Streaming entwickelt worden. Wer diese Formate für das Archivieren verwendet, befindet sich weitab von unserem Thema. Er wird feststellen, daß ihnen die erforderliche Güte fehlt, wenn man sie auf einer HIFI-Anlage wiedergibt. Auf Computerboxen ist vielleicht noch kein Unterschied hörbar, aber bereits mit Mittelklasse-Kopfhörern sollten Unterschiede wahrnehmbar sein. (Wenn nicht, wäre dringend ein Termin beim HNO-Arzt angesagt. Es könnte da eine hohe Toleranz gegenüber hörbaren Artefakten eingesetzt haben, was nicht ungewöhnlich wäre. "Selektives Hören"  kann nämlich auch kulturelle Hintergründe haben und wird oftmals durch Konditionierung und (Auto-)Suggestion bei untrainierten Hörern beeinflußt.)

Überprüfen wir nun aber die aus der Produkt-Reklame einiger kommerzieller Formate stammenden Zitate und halbieren rechnerisch die Bitrate unterhalb einer festgestellten Transparenz bei einem Musikstück, um eine Halbierung der Dateigröße zu erhalten: Das wären dann Audiodateien mit einer Nominalbitrate von 70-80 kb/s VBR, die eigentlich allenfalls als Futter für den PC-Papierkorb taugen. Ohne eine meist patentpflichtige Hardwareunterstützung (MP3pro, AACplus, Atrac3plus) oder Tricks, wie etwa den SBR-Modus, funktioniert hier nichts, um einen erträglichen Klang trotz konstant hörbarer Verzerrungen zu erreichen. Eine Ausnahme bei Bitraten dieser Größenordnung stellt Ogg-Vorbis dar, welches durch Optimierungen relativ erträglich bleibt und anhörbare Dateien erstellt, ohne die Finessen nachträglicher Hardwareunterstützung oder Tricks bei der Wiedergabe zu nutzen. Dennoch bieten die lizenz- und patentpflichtigen SBR-Formate einen hörbaren technischen Vorteil, sobald die Bitrate gleich oder kleiner als 64 kbps ist.

Eine Halbierung der Dateigrößen oder eine Verdopplung der Spieldauer ist somit schlichtweg unmöglich; jedenfalls nicht ohne hörbare gravierende Qualitätsverluste. Jedwede Erstellung von Audiodateien unterhalb der Transparenzgrenze basiert ausschließlich auf der Kompromissbereitschaft des Hörers und den Rahmenbedingungen der Wiedergabe. Auch durch Formatwechsel sind keinerlei Platzgewinne ohne hörbaren Qualitätsverlust möglich.

Hier gehts zum Auditorium ...

6 bearbeitet von DAU (Original: 2005-04-17 00:03)

Re: Audiokompression und planbare Kompromisse

1.4. Zusammenfassung

Archivqualität ist mit bitidentischen 1:1 Secure-Mode-Kopien (EAC, dBpowerAmp und Plextools), Lossless-Komprimierung und Lossy oberhalb der Transparenzgrenze gegeben. AccurateRip gibt zusätzliche Sicherheit durch den Vergleich der Ausleseergebnisse mit anderen Benutzern. Als Kriterien für die Formatwahl spielen die Unterstützung durch Hardware-Decoder, der Wunsch nach Gapless Playback oder die Software-Unterstützung durch das jeweilige Betriebssystem eine wichtige Rolle. Die Herstellung einer CD-R aus einem Archiv ist problemlos möglich. Sie besitzt dann ebenfalls Transparenz. Entsprechende Dateien können außerdem als Quelle für die weitere Bearbeitung benutzt werden.

Klon- oder Burst-Mode-Brennprogramme können keine bitidentischen Kopien garantieren, sondern lesen oberflächlich den ISO-Layer einer CDDA aus und sind nicht in der Lage, den originalgetreuen Inhalt zu extrahieren. Sie geben dem Nutzer auch keine Rückmeldung bei Fehlern, sondern gehen einfach darüber hinweg. Die Erstellung von Burst-Mode-Images hat nichts mit dem Feld der Audiokompression und hochwertiger digitaler Audio Extraction zu tun, denn sie dienen der "quick and dirty"-Reproduktion für mobile Zwecke (z.B. für ein Autoradio) oder zum Klonen kopiergesperrter Werke .

Lossy Kopien unterhalb der Transparenzgrenze und Klon-Kopien von CDDA und CD-R erfüllen Qualitätskriterien nicht, weshalb es sich hier um Verbrauchsmaterial handelt. Nutzer aus der Fun-Fraktion und Kopierbörsennutzer werden eventuell zufriedengestellt, weil sie auf wenig Platzverbrauch und größtmögliche Kompatibilität zum Freundeskreis und zu preiswerter mp3-Hardware Wert legen. Dieses Material ist nicht als Quelle für eine Weiterverarbeitung in Form von Reencodierung oder Transcodierung geeignet, weil die zusätzlichen Transcodierverluste zu den bereits hörbaren Kompressionsartefakten und Extraktions-Fehlern hinzukommen und sich summieren. Verbrauchskopien für portable Abspielgeräte, Auto-HiFi und (Billig-)Hardwaredecoder bilden die Ausnahme.

Jeder Nutzer muß für sich selbst entscheiden, ob er Archivqualität nutzen möchte, bekommt dafür aber ein hohes Maß an Zukunftssicherheit und kann auf Jahre davon ausgehen, daß er einen Audiodatenträger nur einmal anfassen muß, um ihn auf die Festplatte zu rippen. Ein geringfügig höherer Zeitaufwand ergibt sich nur einmal beim Rippen der CD durch die Benutzung des Secure-Mode. Eventuell ist bei Lame/Ogg-Vorbis die Encodierdauer etwas höher. Dieser Nachteil kann jedoch z.B. durch die Wahl des Musepack Encoders wegen dessen Geschwindigkeitsvorteils ausgeglichen werden.

Die Qualität eines Archives wird nicht durch die Wahl eines "Wunderformates" bestimmt, sondern durch die Art der Erstellung. Preset- oder gar Formatwechsel sind nicht nötig, wenn bei der Erstellung von vornherein auf Transparenz geachtet wird. Dies sorgt dann auch für einen einmaligen Zeit-  bzw. Arbeitsaufwand, der später bei einem eventuellen Formatwechsel nicht noch einmal komplett aufgebracht werden muß. Es entsteht übrigens kein Vorteil durch den Wechsel von einem transparenten MP3- zu einem transparenten AAC-Archiv.

Aus unserer Sicht eignen sich vor allem Musepack, Ogg-Vorbis,  Monkey's Audio, FLAC und LAME-mp3 als Formate für die Archivierung. (Dies gerade auch im Hinblick auf die existierende Wissensallmende und die Vermeidung der Folgen von so genannten Software-Patenten.) Die Albenordner eines Archivs können mit Liedtexten (Lyrics), Videos, Artikeln und Coverscans aufgewertet werden, was dazu führt, daß das Archiv in der Präsention dem Erscheinungsbild eines wohlgefüllten CD-Regals entsprechen kann. In Bezug auf Kriterien wie Suchgeschwindigkeit, Gapless Playback, Zugriffszeiten, Ausbaumöglichkeiten und Komfort beim Abspielen, sind vom jeweiligen Benutzer zusammengestellte computerbasierte Archivlösungen den Fertigprodukten aus dem Consumer-HIFI-Bereich deutlich überlegen.

Aus dem bisher Vorgetragenen ergibt sich folgende Reihung hinsichtlich der hörbaren Qualität encodierter Audiodateien:

  1. Archivqualität ~ transparente Lossy und Lossless Dateien

  2. CD-Qualität ~ nicht transparente Lossy Dateien

  3. Light-Qualität ~ nicht transparente Lossy Dateien für Streaming und portable Lösungen<br> unter Zuhilfenahme von SBR oder Optimierungen für niedrige Bitraten

  4. Minderwertig ~ Dateien unbekannter Herkunft, wie z.B. Filesharingdateien, transcodiertes Material <br> oder Mitschnitte von Radiostreams/Line-IN

Weiterhin ergibt sich folgende Reihung hinsichtlich der hörbaren Qualität von per DAE ausgelesenen Audiodateien:

  1. Archivqualität ~ mit EAC per Secure Mode ausgelesen, mit DBpowerAmp unter Verwendung von Accurate Rip ausgelesen, mit Plextools ausgelesen, mit CDparanoia unter Linux ausgelesen

  2. CD-Qualität ~ Klonkopien, Audiograbber, CDex, iTunes, Musicmatch, Windows Media Player, Real Player, ...

  3. Minderwertig ~ Dateien unbekannter Herkunft, z.B. per Filesharing

Die seitens Real Audio, Nullsoft und Apple gepushten AAC-Formate bringen keine signifikanten Verbesserungen mit sich. Bisher bietet MP3 gegenüber AAC sogar immer noch Vorteile. Hier funktionieren mit LAME-mp3 und Foobar2000 die lückenlose Wiedergabe, das Replaygainen und das Brennen. Das Taggen von mp3 würde sich deutlich verbessern lassen, wenn die entsprechende Hard- oder Software APE2-Tags verarbeiten könnte. PCs sind deshalb b.a.w. allen derzeitig verfügbaren HIFI-Geräten überlegen. Nur mit einem PC/Mac mit direktem Anschluss an die HIFI-Anlage lassen sich derzeit alle gebotenen Features nutzen, wie auch die größtmögliche Audioqualität erreichen.

Abschließend kann man natürlich noch die besprochenen Qualitätsstufen sinnvoll bestimmten Geräteklassen zuordnen. Das sähe dann so aus.

  1. Rechnerbasierte Audiowiedergabe mit direktem <br>Anschluss an die HIFI-Anlage ~Archivqualität und CD-Qualität

  2. mp3-fähige DVD-Player und großvolumige <br>portable Player mit HD~CD-Qualität und Light-Formate

  3. Flashplayer, USB-Sticks, Webradio und Handys~Light-Formate

Nun stellt sich natürlich noch die Frage, wie die Codec-Landschaft und die entsprechende Verbreitung der hier favorisierten Audioformate wohl ausschauen würden, wären die Gratis-Encoder mit ähnlich großen Werbeetats, Anzeigen und teilweise dauerpräsenten Beiträgen in der Computerpresse gefördert worden. Interessanterweise wurden z.B. Ogg-Vorbis und Musepack nie beworben, aber trotzdem haben sich diese Formate etabliert. Die Gründe für den Erfolg liegen hier m.E. vor allem in der Mund-zu-Mund-Propaganda und in der Art und Weise, wie Entwickler und Nutzer miteinander kommunizieren. Die Entwickler- und Unterstützergruppen stehen den Anwendern recht nah, da Foren oder Diskussionsplattformen, wie etwa Hydrogenaudio, es ermöglichen, auf Anregungen und Bugmeldungen umgehend zu reagieren. Diese Linux-ähnlichen Entwicklungs- und Supportkonzepte haben zu rasanten und hervorhebenswerten Ergebnissen geführt. Der Wettkampf der Ideen zwischen Freier Software und der mit dem Ziel der Profitmaximierung produzierten bleibt demnach weiterhin spannend und beobachtenswert.

Hier gehts zum Auditorium ...

7 bearbeitet von Lego (Original: 2005-04-17 00:05)

Re: Audiokompression und planbare Kompromisse

ausgegliederte Teile

Hier gehts zum Auditorium ...

8 bearbeitet von Lego (Original: 2005-04-17 00:14)

Re: Audiokompression und planbare Kompromisse

Anhang:

Hier gehts zum Auditorium ...

9 bearbeitet von Lego (Original: 2005-04-17 00:32)

Re: Audiokompression und planbare Kompromisse

Anmerkungen

  • Ein sehr großer Teil der am Hörtest aktueller Encoder beteiligten untrainierten Versuchspersonen hatte mit normaler Musik (Pop) oberhalb 128 kbps Probleme, in Blindhörtests die Teststücke genau zuzuordnen. Artefaktehören ist Übungssache, kann aber erlernt werden.

  • Benutzer, die in Vergleichstests in ihrer Sensitivität eher auf Preechos als Erkennungsmerkmal reagieren, präferieren Musepack.

  • Benutzer, die in Vergleichstests in ihrer Sensitivität eher auf Artefakte als Erkennungsmerkmal reagieren, präferieren Ogg-Vorbis und AAC.

  • In den Online-Music-Shops werden meinen Informationen zufolge Dateien in Bitraten von 128-192 kbps verkauft. Die Deklaration als "CD-Qualität" verwirrt viele Anwender. Laut verschiedener Hörtests in Computerzeitschriften bewegt sich die Klangqualität aber meilenweit entfernt von einer gekauften OriginalCD; dies fällt insbesondere bei WMA-Downloads auf. Nur Allofmp3 bietet bessere Qualitäten wie etwa Lossless und LAME-mp3 an.

  • Um Gapless Playback steht es im Softwarebereich immer besser. Viele Anwendungen ermöglichen mittlerweile Gapless Playback; z.B. per MAD-Plugin oder auf Basis von mpg123 Bibliotheken.

  • iTunes, die populäre iPod-Befüllungssoftware und mp3-Jukebox bieten derzeit aber immer noch kein Gapless Playback.

  • Replaygaining scheint sich inzwischen auch zu etablieren und wird von vielen Software-Playern unterstützt. Vergleichbare (wenn auch simplere) Formen des Volumelevelling finden sich mittlerweile sogar in vielen Einsteiger-Anwendungen, wie etwa dem Windows Media Player oder iTunes. Leider meist in zueinander inkompatiblen Umsetzungen, wie bei Apple-Soundtouch oder auch bei der MS Lösung für den WMP.

  • Weitverbreitet und wieder in Mode gekommen ist das Konsumieren und Erstellen nicht transparenter Audiodateien für DVD-Player und mobile Geräte. Die rechnerbasierte Wiedergabe nutzt dagegen zunehmend die Möglichkeiten der Lossless Formate, flexibles Tagging und Replaygain.

  • Hersteller von HIFI-Geräten decken fast ausschließlich nur den Bereich CD/SACD/DVD-A/DVD ab. Meist werden ein rotierender Datenträger und immer noch über Brenner replizierbare Formate verwendet. Nur SACD kann derzeit noch nicht am PC erzeugt werden, weshalb die DVD-A vermutlich auch größere Chancen für die Zukunft haben könnte, wenn sich preiswerte DVD-A taugliche Authoring-Software verbreitet. Die Bereiche Wiedergabegeräte für Lossless und transparente Audiodateien scheint derzeit noch kein populärer HIFI-Hersteller abdecken zu wollen.

  • Die rechnerbasierte Wiedergabe von Audio erscheint derzeit als kostengünstigere und auch technisch flexiblere Möglichkeit im Bereich der Archivierung.

  • Personalisiertes und flexibles Tagging ist derzeit auschließlich mit Foobar2000 und Mp3Tag möglich.

  • MP3Pro ist bereits seit langer Zeit (auch von offizieller Seite) zu Abandonware erklärt worden. Dies, wohlgemerkt, ohne sich jemals ernsthaft verbreitet zu haben. Fehlende Software-Updates auf der CodingTechnologies-Homepage bestätigen dies. Für die Zukunft ist die Verwendung von AACplus anzuraten.

Stand: Juni 2006

Hier gehts zum Auditorium ...

10 bearbeitet von Lego (Original: 2005-10-09 18:20)

Re: Audiokompression und planbare Kompromisse

Update

CHIP-Test: Audio-Codecs

Anmerkung:
Archivqualität und weitreichende Transparenz sind eigentlich zwei verschiedene Dinge. Im 58er Thread und auf AudioHQ haben wir uns vor etwa mehr als 2 Jahren darauf geeinigt, aus Gründen der "Rückwärtskompatibilität" auch mit Lame und anderen Lossy zu arbeiten.

Präzisiert man den Begriff "Archivqualität" um das Kriterium "Authenzität", so bleiben nur noch Lossless-Codecs übrig. Das war aber zum damaligen Zeitpunkt für den Start einer "Info-Domain zur Audiokompression" kaum zumutbar, deshalb starteten wir mit dem minimal aufgeweichten Begriff. Allerdings ist Archivqualität mit Authenzität mW immer noch unsere Zieldefinition, weshalb an vielen Stellen durchblickt, daß wir eher Lossless empfehlen.

Da aber die Audiokompression nicht nur aus pcbasierten Komponenten besteht, haben wir uns damals auch für Encoder mit Einstellungen die zur Transparenz führen entschieden, um den Begriff für "Hardwaredecoder" von der anderen Seite her auch zu füllen. Die nennt man dann Pragmatismus, weil weitreichende Transparenz auch ausreicht um ein Archiv mit Inhalten zu füllen. Wir sind damit in jedem Falle auf der sicheren Seite, weil auf den Hardwaredecodern kein Unterschied zum Original hörbar ist, bzw kein Testszenario konstruierbar ist, um fehlende Transparenz nachzuweisen, also effektive Transmission gegeben ist. Der Pragmatismus ist offensichtlich, wenn keine hörbaren Unterschiede durch die Rahmenbedigungen ermittelt werden können, so erfüllen Lossless als auch unsere "minimal aufgeweichte Definition" den Zweck und erfüllen die Anforderungen.

Wechseln wir einmal den Blickwinkel und schauen uns an, welche Inhalte AudioHQ vermitteln will, dann werden diese Entscheidungen und der uns "aufgezwungene Pragmatismus" noch deutlicher. AudioHQ war (auch vor meiner Zeit) eine Info-Domain um qualitätsorientiertes Arbeiten zu vermitteln. Als wir AudioHQ neustarteten und ich einstieg war klar, daß dies kompromisslos nur mit Lossless möglich sein wird. Entgegen kam uns natürlich vopr zwei Jahren, daß für uns absehbar war, daß die expotential Festplattengrößen diesem Anliegen entgegen kommen werden.

Ein weiterer Wechsel des Blickwinkel macht es noch deutlicher, worauf wir hinaus wollten. Sobald Transparenz oder per Lossless Authenzität gegeben ist, lernt man die Vorzüge eines "genügend hochwertigen" Umgangs mit den Encoder kennen. Als Lerneffekt ist dies ausreichend, um unsere Klientel an uns zu binden, da keine andere deutschsprachige Seite sich um qualitätsorientierten Umgang mit Audiokompression bemüht. Alle anderen bemühen sich mit allerlei Verrenkungen auch um größtmögliche Rückwärtskompatibilität. Sobald ein AudioHQ aber diesen Lernprozess abgeschlossen hat, ist er in der Lage für sich selbst zu entscheiden, wann und wie er Lossy einsetzt oder einen Lossless-Codec, oder gar ein Privatarchiv auf allerhöchstem technischen Niveau anlegt, Erfahrungswissen und Synergien nutzt, um etwas aufzubauen, was sogar unsere Methoden oder Empfehlungen übersteigt. Auch das parallele Arbeiten an einem Archiv und das gleichzeitige Encodieren für Hardwareencoder, Netzwerkstreaming, Autoradios, mp3-CDs und
portable Geräte sind mit den heute verfügbaren schnellen Rechnern kein Problem mehr. Klar sollte aber sein, daß Authenzität für letztgenannte Zwecke absolut overdressed sind, insofern sich also ein Pragmatismus zwingend ergibt.

Auch im Falle eines Missverständnisses oder bei Unklarheiten, geht im Zweifelsfall schon allein aus dem Begriff Archivqualität hervor, dass es bei AudioHQ ums archivieren geht und nicht nur darum "irgendwas irgendwo irgendwie" abzuspielen oder zu sammeln.   

Im Ergebnis bekommen wir dadurch natürlich eine mehrdeutige Definition von Archivqualität, das war uns aber von Anfang bewußt, sehen wir aber nicht als Problem, da alle Bedeutungen hinlänglich durch Inhalte gefüllt werden, auch dann wenn "Archivqualität" als allerkleinster Nenner aus unserem Erfahrungswissen heraus eine empfehlenswerte Qualität ist, mit der man genügend hochwertig ein Archiv bei zeitweise begrenztem HD-Volumina aufbauen kann. Geügend hochwertig war als untere Grenze die weitreichende Transparenz. 

Was die Ausrichtung betraf, so hat Frank die Richtlinienkompetenz, genauso wie sie Benjamin für www.Vorbis.AudioHQ.de hat. Deshalb haben wir das, was ich hier geschrieben habe, auch nie in Text gegossen, mal abgesehen davon, daß das Qualitätsressort und der ursprüngliche Ansatz des 58er Grundlagenartikel zu "Archivqualität" inhaltlich in mein Ressort fiel, wir uns im Team aber natürlich abgestimmt haben welcher "globalen Linie" zu den Inhalten wir folgen.

EDIT:
All diese Dinge sind fast nur für Leute wichtig, die planen eine Webseite und Inforessource aufzubauen, deren Ziele zu formulieren und diese zu leiten. Eine "Leitungsfunktion zur grundlegenden Ausrichtung" in dieser Hinsicht hatte auch nur Frank (vorher Volcano und Frank), während ich fast ausschließlich nur an meinen Inhalten gearbeitet habe und anfangs Gast war.

Hier gehts zum Auditorium ...

11 bearbeitet von Lego (Original: 2006-09-24 17:16)

Re: Audiokompression und planbare Kompromisse

Es gab hin und wieder mal Anfragen warum ich angesichts der immer besser werden Fähigkeiten von Leselaufwerken zahlreiche Ausleseprogramme für die Archivierung ausschließe oder begründet davon abrate.

Deshalb nochmal zur Klärung:

Der Vorteil von Secure Mode-Anwendungen (Foobar2000, EAC, cdparanoia) ist, man bekommt eine Rückmeldung. Alle anderen Ripper melden entstehende Probleme nicht zurück. Dadurch fallen aber mögliche Lesefehler nicht auf, wenn man sie nicht eben mal zufällig in der Sammlung auffällig heraushören kann.

Gäbe es keine SecureMode-Ripper so müsste man eigentlich gleich nach dem Rippen das per DAE ausgelesene konzentriert durchhören

Ripper ohne Secure Mode sind:

  • Audiograbber

  • CDEX

  • iTunes Jukebox

  • Winamp

  • Nero

  • Feurio

  • alle Magix-Programme

  • alle Adobe-Produkte

  • alle Pinnacle-Produkte

  • MusicMatch Jukebox

  • Jetaudio

  • Windows Media Player

  • RealPlayer

  • Freerip

  • LameFE

  • viele viele andere

Sie alle verlassen sich auf die Fähigkeit des Laufwerks und solange man eben keine Rückmeldung bekommt, geht man davon aus, daß einwandfrei gerippt wird, was nicht wirklich immer stimmen muss, egal ob das Leselaufwerk jetzt außer der AccurateStreaming-Eigenschaft nun noch andere Anforderungen erfüllt.

Für die Erstellung von Audio-Dateien für ein portables Abspielwerkzeug ist das auch überhaupt nicht wichtig.

Will man hingegen Musik archivieren oder ein CD-Backup pflegen so kann man schwerlich auf den Secure Mode verzichten, da man nur über die Rückmeldung (zB Eac *.log Datei, Foobar2000 Konsole etc) überhaupt eine Auskunft über die Authenzität (gegenüber dem Original) der ausgelesenen Inhalte erhält.

Bleibt noch die Frage hinsichtlich der Fähigkeit von PC-Leselaufwerken, die sich ähnlich den "normalen Hifi-Laufwerken" verhalten, also bei Lesefehlern interpolieren oder stummschalten. Diese Fähigkeit halte ich nur dann für wichtig, wenn man vorhat kopiergesperrter Datenträger (also nicht-AudioCDs) wiederzugeben und häufig AudioCDs über den Rechner abspielt. Für uns hat diese Fähigkeit aber wohl keine Bedeutung, da wir versuchen den inhalt für die Archivierung mit einem Nachweis der Authenzität vom Medium zu trennen.

Ein weiterer kleiner Punkt der für SecureMode-Software spricht ist auch, daß man mit Lese/Schreiboffsets arbeiten kann, nur EAC und dBpowerAmp in der Lage sind eine CD mit den entsprechenden Offsets und Rückmeldung der Ergebnisse auszulesen und dann auch wieder auf ein Medium (CD-R, CD-RW) mit dem entsprechenden Schreiboffset zu brennen. Nur dieses Vorgehen gewährleistet, daß man hernach auch die 1:1-Kopien wieder mit den selben CRC einlesen kann.

Genau das können BurstMode-Imager (CloneCD, Nero, etc) eben nicht, bei ihnen gibt es keine Rückmeldung, keine Strategie für die Caching-Problematik und auch keine Rückmeldung über die Qualität der Brennergebnisse wie beim Plextor Premium in Kombination mit den Plextools oder .

BurstMode-Ripper und Klonprogramme kann man deshalb wie ich es bereits dargelegt habe deshalb auch komplett vergessen, wenn man das Ausgelesene archivieren möchte.

Hier gehts zum Auditorium ...

12

Re: Audiokompression und planbare Kompromisse

Zum Thema Gapless Playback bei mp3: Mittlerweile beherrschen auch Winamp, iTunes und vereinzelt sogar mp3-Portys (auch aktuelle iPods) die lückenlose Wiedergabe bei mp3s "ab Werk", d.h. ohne weitere Modifikationen vornehmen zu müssen.

Bei iTunes bin ich mir zwar nicht zu 100% sicher, denke aber, daß mittlerweile keine billigen Workarounds mehr verwendet werden.

Bitte im entsprechenden Absatz ergänzen!

Raubkopieren ist nicht der ideologische Kampf gegen das böse System,
sondern egoistische, arrogante, knausrige Scheiße.

Beiträge [ 12 ]

Seiten 1

Sie müssen sich anmelden oder registrieren, um eine Antwort zu verfassen

AudioHQ » Audiokompression allgemein » Audiokompression und planbare Kompromisse

Ähnliche Themen