![]() |
||
|
|
Audio-Codecs zur SprachdigitalisierungWie bei der Digitalisierung von Sprache für die Fernsprechübertragung arbeiten Codecs nach dem Prinzip Sampling, Quantisierung und Kodierung. Dadurch erreicht man eine optimale Sprachqualität, um das analoge Sprachsignal über digitale Systeme zu übertragen. Codecs zur Sprachdigitalisierung müssen noch ein paar Bedingungen mehr erfüllen können. Bedingt durch die Struktur des Internets (paketorientierte Übertragung und Vermittlung) müssen sie Paketverluste (bis zu 5%) verkraften und Laufzeitunterschiede der einzelnen Pakete ausgleichen und in die richtige Reihenfolge sortieren können (Forward Error Correction und Jitter Buffering). Das bedeutet, dass Paketverluste und Laufzeitschwankungen keinen Einfluss auf die Sprachqualität haben dürfen. MOS - Mean Opinion Score
Von Bell Labs wurde der "Mean Opinion Score" (MOS) definiert. Der MOS ermittelt das statische Empfinden der Sprachqualität eines Benutzers. Der MOS 4 gilt als Grenzwert. Darüber wird die Sprachqualität besser, darunter schlechter.
Die Auswahl eines Codecs ist immer ein Kompromiss zwischen Sprachqualität, Bitrate, Bandbreite und Rechenleistung. Muss die Sprachqualität sehr gut sein, dann ist die Bitrate sehr groß. Entsprechend muss eine ausreichende Bandbreite über die gesamte Übertragungsstrecke zur Verfügung stehen. Reicht eine geringere Sprachqualität aus, dann sinkt dadurch die Bitrate und der Bedarf an Bandbreite. Gleichzeitig steigt dabei der Bedarf an Rechenleistung, um die Sprachdaten zu dekomprimieren. G.711G.711 ist der älteste Codec überhaupt. Er wurde bereits 1965 von der ITU zugelassen. Er benötigt nur eine geringe Rechenleistung, erzeugt dafür einen Datenstrom von 64 kBit/s. G.722Der Codec G.722 bewertet die Signaldifferenz zwei aufeinanderfolgender Signale. So lässt sich mit der selben Bitrate von G.711 ein Sprachsignale bis 7 kHz mit einer Abtastrate von 16 kHz digitalisieren. Das Frequenzband reicht von 50 Hz bis 7.000 Hz. Der Bandbreitenbedarf liegt bei 48, 56 oder 64 kBit/s. G.723.1Durch ein Prädiktionsverfahren erreicht dieser Codec mit einer Bitrate von 5,6 oder 6,3 kBit/s, einer Audiobandbreite von 3,1 kHz und einer Bitbreite von 8 Bit eine etwas geringere Sprachqualität als G.711. G.729Bei G.729 handelt es sich um die optimierte Variante des CELP-Algorithmus für Sprachübertragungen. G.729 ist mit G.723 vergleichbar. Der Bandbreitenbedarf liegt nur bei 8 kBit/s, wodurch eine geringere Rechenleistung im Vergleich zu G.723 erforderlich ist. Linear-PCM 16 (L16)Linear-PCM 16 (L16) ist von der TIA (Telecommunications Industry Association) im Rahmen der Spezifikation TIA 920 für Breitband-Kommunikation definiert (Breitband-Internet-Anschlüsse). Das Sprachsignal wird 16.000 mal pro Sekunden abgetastet (Sampling). Die Sprachdaten werden mit 16 Bit aufgelöst (Quantisierung). Die Übertragung findet ohne Kompression, ohne Latenz und ohne Umwandlung statt. L16 bietet so die beste Übertragungsqualität. PCMA-16PCMA-16 ist eine 16 kHz-Variante des G.711-Codecs. PCMA-16 bietet eine Abtastrate von 16.000 Samples pro Sekunde (Sampling). Die Sprachdaten werden nach dem A-Law in 8 Bit aufgelöst (Quantisierung). GSMGSM ist der Codec für die Sprachübertragung im Mobilfunknetz. Die Bandbreite beträgt 13,2 kBit/s. iLBCDer Codec iLBC ist für schmalbandige Übetragungsstrecken im Internet entwickelt worden. Er ist speziell darauf optimiert, im Falle von verloren gegangenen und verzögert eingetroffenen Datenpaketen, eine gleichbleibende Sprachqualität und -verständlichkeit zu liefern. Der Codec besitzt eine höhere Qualität als G.729. Die Bandbreite liegt bei 13,33 kBit/s. Speex (SPX)Speex zeichnet sich dadurch aus, dass er eine variable Bitrate hat und somit optimal an die Sprachübertragung angepasst ist. So zum Beispiel an Sprechpausen, in denen so gut wie keine Daten anfallen. Die Bandbreite liegt zwischen 2,15 und 24,6 kBit/s. SkypeSkype verwendet einen propritären Codec, der Audio bis rund 12 kHz übertragen kann. Übersicht der Audio-Codecs
Weitere verwandte Themen:Bookmark
|