|
|||||||||||||||||||||||||||||||||||||||||
| ISBN: 3423050012 ISBN: 3423050012 ISBN: 3423050012 ISBN: 3423050012 | |||||||||||||||||||||||||||||||||||||||||
|
Wir empfehlen: | ||||||||||||||||||||||||||||||||||||||||
Überlagerung der MaskierungskurvenIn der ISO-Beispielimplementation für den MPEG-Encoder, also im anfänglichen MPEG-Modell wird die resultierende Maskierungskurve folgendermaßen berechnet. Man geht von einer linearen Addition der einzelnen Maskierungskurven aus. Weil diese aber unterschiedlich sind, je nach dem, ob der Maskierer eher ein Ton (ideal: eine einzige Frequenz) oder ein Geräusch (ein breites Band von Frequenzen) ist, wird vorher die Art des Maskierers bestimmt. Damit erzielt man relativ gute Resultate. Im hohen Frequenzbereich wird aber z.B. davon ausgegangen, dass Maskierer eher Geräusche als Töne sind, denn Rauschen tritt üblicherweise genau in diesem Bereich auf. Dadurch wird bei Tönen mit hohen Frequenzen eine zu breite Maskierungskurve berechnet.Ein neuerer Ansatz propagiert dagegen, dass die Maskierungskurven sich in nichtlinearer Form addieren. Damit erhält man nach Untersuchungen deutlich bessere Ergebnisse als mit dem ursprünglichen MPEG-Ansatz, denn auch das Gehör scheint auf einer Nichtlinearität zu basieren ([FB]). 4. MPEG-1 Layer 3 AlgorithmusDer Algorithmus zur Kodierung von MPEG Layer 3-Dateien beinhaltet folgende Schritte: Zuerst wird das Audiosignal in den Frequenzbereich überführt. Die Maskierungskurve zum jeweiligen Zeitpunkt wird bestimmt und die Frequenzdaten werden aufgrund dieser Daten entsprechend quantisiert. Dieses geschieht in einem iterativen Prozess, der auch eine Kodierung der Ausgabedaten mit dem Huffman-Verfahren beinhaltet.Abbildung 6 ([KB]) stellt den groben Aufbau eines MPEG Layer 3-Encoders dar. Gelb markiert ist die im folgenden Abschnitt erklärte Wandlung des Audiosignals in die Frequenzdarstellung. Die blau unterlegten Blöcke beinhalten die Berechnung des psychoakustischen Modells. In den roten Abschnitten erfolgt die eigentliche Kodierung, wie sie in Abschnitt 4.2 beschrieben wird. Der grüne Abschnitt formatiert den Ausgabestrom und fügt, wenn gewünscht, unter anderem eine Fehlererkennung und -korrektur mittels CRC (Cyclic Redundancy Code) hinzu. Zunächst wird der Algorithmus für einen Audiosignalkanal erklärt, denn er arbeitet bei mehreren Kanälen zu größten Teil auf jedem Kanal einzeln. Wie man Stereodaten möglichst effektiv komprimiert, wird erst danach erläutert (siehe Abschnitt 4.4).
4.1. Umwandlung in die FrequenzdarstellungDie bei der Zeit-Frequenz-Umwandlung eingesetzte Filterbank ist eine sogenannte Hybrid-Filterbank (verflechtete Filterbank). Die Verflechtung besteht dabei in einer Hintereinanderschaltung einer Polyphase Filterbank wie sie auch beim MPEG Audiolayer 1 oder 2 eingesetzt wird, gefolgt von einer modifizierten diskreten Cosinustransformation (MDCT).Frame-BildungZu Anfang wird das Audiosignal in kleiner Abschnitte, sogenannte Frames unterteilt. Ein Frame in Layer 3 besteht aus 1152 Samples. |
|
||||||||||||||||||||||||||||||||||||||||
| |<< First < Previous Index Next > Last >>| | |||||||||||||||||||||||||||||||||||||||||
|
Back to the topic site: StudyPaper.com/Startseite/Computer/Informatik External Links to this site are permitted without prior consent. | |||||||||||||||||||||||||||||||||||||||||
| Home | deutsch | Set bookmark | Send a friend a link | Copyright © | Impressum | |||||||||||||||||||||||||||||||||||||||||