Title:

Die Audiokodierung mp3.

Home
deutsch
  
ISBN: 3423050012   ISBN: 3423050012   ISBN: 3423050012   ISBN: 3423050012 
 
|<< First     < Previous     Index     Next >     Last >>|
  Wir empfehlen:       
 
 

Überlagerung der Maskierungskurven

In der ISO-Beispielimplementation für den MPEG-Encoder, also im anfänglichen MPEG-Modell wird die resultierende Maskierungskurve folgendermaßen berechnet. Man geht von einer linearen Addition der einzelnen Maskierungskurven aus. Weil diese aber unterschiedlich sind, je nach dem, ob der Maskierer eher ein Ton (ideal: eine einzige Frequenz) oder ein Geräusch (ein breites Band von Frequenzen) ist, wird vorher die Art des Maskierers bestimmt. Damit erzielt man relativ gute Resultate. Im hohen Frequenzbereich wird aber z.B. davon ausgegangen, dass Maskierer eher Geräusche als Töne sind, denn Rauschen tritt üblicherweise genau in diesem Bereich auf. Dadurch wird bei Tönen mit hohen Frequenzen eine zu breite Maskierungskurve berechnet.

Ein neuerer Ansatz propagiert dagegen, dass die Maskierungskurven sich in nichtlinearer Form addieren. Damit erhält man nach Untersuchungen deutlich bessere Ergebnisse als mit dem ursprünglichen MPEG-Ansatz, denn auch das Gehör scheint auf einer Nichtlinearität zu basieren ([FB]).

4. MPEG-1 Layer 3 Algorithmus

Der Algorithmus zur Kodierung von MPEG Layer 3-Dateien beinhaltet folgende Schritte: Zuerst wird das Audiosignal in den Frequenzbereich überführt. Die Maskierungskurve zum jeweiligen Zeitpunkt wird bestimmt und die Frequenzdaten werden aufgrund dieser Daten entsprechend quantisiert. Dieses geschieht in einem iterativen Prozess, der auch eine Kodierung der Ausgabedaten mit dem Huffman-Verfahren beinhaltet.

Abbildung 6 ([KB]) stellt den groben Aufbau eines MPEG Layer 3-Encoders dar. Gelb markiert ist die im folgenden Abschnitt erklärte Wandlung des Audiosignals in die Frequenzdarstellung. Die blau unterlegten Blöcke beinhalten die Berechnung des psychoakustischen Modells. In den roten Abschnitten erfolgt die eigentliche Kodierung, wie sie in Abschnitt 4.2 beschrieben wird. Der grüne Abschnitt formatiert den Ausgabestrom und fügt, wenn gewünscht, unter anderem eine Fehlererkennung und -korrektur mittels CRC (Cyclic Redundancy Code) hinzu.

Zunächst wird der Algorithmus für einen Audiosignalkanal erklärt, denn er arbeitet bei mehreren Kanälen zu größten Teil auf jedem Kanal einzeln. Wie man Stereodaten möglichst effektiv komprimiert, wird erst danach erläutert (siehe Abschnitt 4.4).


Abbildung 6: Aufbau eines MPEG Layer 3-Encoders

4.1. Umwandlung in die Frequenzdarstellung

Die bei der Zeit-Frequenz-Umwandlung eingesetzte Filterbank ist eine sogenannte Hybrid-Filterbank (verflechtete Filterbank). Die Verflechtung besteht dabei in einer Hintereinanderschaltung einer Polyphase Filterbank wie sie auch beim MPEG Audiolayer 1 oder 2 eingesetzt wird, gefolgt von einer modifizierten diskreten Cosinustransformation (MDCT).

Frame-Bildung

Zu Anfang wird das Audiosignal in kleiner Abschnitte, sogenannte Frames unterteilt. Ein Frame in Layer 3 besteht aus 1152 Samples.

 

  
Bürgerliches Gesetzbuch BGB: Mit Allgemeinem Gleichbehandlungsgesetz, BeurkundungsG, BGB-Informationspflichten-Verordnung, Einführungsgesetz, ... und Wohnungseigentumsgesetz
von Helmut Köhler
Siehe auch:
Handelsgesetzbuch HGB: ohne Seehandelsrech...
Arbeitsgesetze
Aktiengesetz · GmbH-Gesetz: mit Umwandlungsges...
Grundgesetz GG: Menschenrechtskonvention, Europäischer Gerichtsh...
Strafgesetzbuch StGB
Einführung in das Bürgerliche Recht: Grundku...
 
   
 
     
|<< First     < Previous     Index     Next >     Last >>| 

Back to the topic site:
StudyPaper.com/Startseite/Computer/Informatik

External Links to this site are permitted without prior consent.
   
  Home  |  deutsch  |  Set bookmark  |  Send a friend a link  |  Copyright ©  |  Impressum