Aufgaben:Aufgabe 3.6: Adaptive Multi–Rate Codec: Unterschied zwischen den Versionen

Aktuelle Version vom 10. August 2019, 15:48 Uhr

Spuren des AMR–Codecs

Ende der 1990er Jahre wurde mit dem AMR–Codec ein sehr flexibler, adaptiver Sprachcodec entwickelt und standardisiert. Dieser stellt insgesamt acht verschiedene Modi mit Datenraten zwischen $4.75 \ \rm kbit/s$ und $12.2 \ \rm kbit/s$ zur Verfügung.

Der AMR-Codec beinhaltet wie der in Aufgabe 3.5 behandelte Vollraten–Codec (FRC) sowohl eine Kurzzeitprädiktion (LPC) als auch eine Langzeitprädiktion (LTP). Allerdings sind diese beiden Komponenten anders realisiert als beim FRC.

Der wesentliche Unterschied von AMR gegenüber FRC stellt die Codierung des Restsignals (nach LPC und LTP) dar:

Anstelle von „Regular Pulse Excitation” (RPE) wird beim AMR–Code das Verfahren „Algebraic Code Excitation Linear Prediction” (ACELP) angewendet.
Aus dem festen Codebuch (FCB) wird für jeden Unterrahmen von $5 \ \rm ms$ Dauer derjenige FCB–Puls und diejenige FCB–Verstärkung ausgewählt, die am besten zum Restsignal passen (für die der mittlere quadratische Fehler des Differenzsignals minimal wird).

Jeder Eintrag im festen Codebuch kennzeichnet einen Puls, bei dem genau $10$ der $40$ Positionen mit $\pm1$ belegt sind. Hierzu ist anzumerken:

Der Puls ist in fünf Spuren mit jeweils acht möglichen Positionen aufgeteilt, wobei die Spur $1$ die Positionen $1,\ 6,\ 11$, ... , $36$ des Unterrahmens und Spur $5$ die Positionen $5,\ 10,\ 15$, ... , $40$ beschreibt.
In jeder Spur sind genau zwei Werte $\pm1$, während alle anderen sechs Werte $0$ sind. Die beiden $±1$–Positionen werden mit je drei Bit – also mit $000$, ... , $111$ – codiert.
Für das Vorzeichen des erstgenannten Pulses wird ein weiteres Bit verwendet, wobei eine „$1$” ein positives Vorzeichen und eine „$0$” ein negatives Vorzeichen kennzeichnet.
Ist die Pulsposition des zweiten Impulses größer als die des ersten Impulses, so hat der zweite Impuls das gleiche Vorzeichen wie der erste, ansonsten das umgekehrte.
Zum Empfänger werden somit pro Spur sieben Bit übertragen, außerdem noch fünf Bit für die so genannte FCB–Verstärkung.

In der Grafik sind die $35$ Bit zur Beschreibung eines FCB–Pulses beispielhaft angegeben.

Spur 1 beinhaltet

einen positiven Impuls $({\rm VZ} = 1)$ bei $1$ (erste mögliche Position für Spur 1) $\hspace{0.2cm}\text{plus}\hspace{0.2cm}0$ (Bitangabe für „ 000”) $= 1$,
einen weiteren positiven Impuls (da $110 > 000$) bei der Position $1 \hspace{0.2cm}\text{plus}\hspace{0.2cm}5$ (Pulsabstand in jeder Spur) $\hspace{0.2cm}\text{mal}\hspace{0.2cm}6$ (Bitangabe für „ 110”) = $31\hspace{0.05cm}.$

Spur 2 beinhaltet

einen negativen Impuls (${\rm VZ} = 0$) bei $2$ (erste mögliche Position für Spur 2) $\hspace{0.2cm}\text{plus}\hspace{0.2cm}5\hspace{0.2cm}\text{mal}\hspace{0.2cm}4$ (Bitangabe für „ 100”) = $22\hspace{0.05cm},$
einen positiven Impuls (Vorzeichenumkehr wegen $011 > 100$) bei der Position $2 \hspace{0.2cm}\text{plus}\hspace{0.2cm}5\hspace{0.2cm}\text{mal}\hspace{0.2cm}3$ (Bitangabe für „ 011”) = $17\hspace{0.05cm}.$

Hinweise:

Diese Aufgabe gehört zum Kapitel Sprachcodierung.

Bei der Eingabe der Pulspositionen bezeichnet $N_{1}$ das erste Bit–Tripel und $N_{2}$ das zweite.
Man müsste zum Beispiel für Spur $2$ die Werte $N_{1}=-22$ und $N_{2}=+17$ eintragen.

Fragebogen

$N_{12.2} \ = \ $

$ \ \rm Bit$

$N_{\rm FCB} \ = \ $

$ \ \rm Bit$

$N_{\rm LPC/LTP} \ = \ $

$ \ \rm Bit$

$N_{1} \ = \ $

$N_{2} \ = \ $

$N_{1} \ = \ $

$N_{2} \ = \ $

$N_{1} \ = \ $

$N_{2} \ = \ $

Musterlösung

(1) Mit der Datenrate $12.2 \ \rm kbit/s$ ergeben sich innerhalb von $20 \ \rm ms$ genau $\underline{244 \ \rm Bit}$, während zum Beispiel im $4.75 \ \rm kbit/s$–Modus nur $95 \ \rm Bit$ übertragen werden.

(2) In jedem Unterrahmen benötigt der FCB–Puls $35 \ \rm Bit$ (fünf Spuren zu je sieben Bit) und die FCB–Verstärkung fünf Bit.

Bei vier Unterrahmen kommt man so auf $N_{\rm FCB} \underline{= 160 \ \rm Bit}$.

(3) Hierfür verbleiben die Differenz aus (1) und (2), also $N_{\rm LPC/LTP}\underline{ = 84 \ \rm Bit}$.

(4) Das Vorzeichenbit „$0$” deutet auf einen negativen ersten Impuls hin.

Wegen $001 < 011$ hat der zweite Impuls das gleiche Vorzeichen.
Die beiden Beträge ergeben sich zu

$$|N_1| \ = \ 3 \hspace{0.1cm}{\rm(da \hspace{0.1cm} Spur \hspace{0.1cm}3)} + 5\cdot 1 \hspace{0.1cm} {\rm(Bitangabe \hspace{0.1cm} 001)} = 8\hspace{0.05cm}, $$

$$ |N_2| \ = \ 3 \hspace{0.1cm}{\rm(da \hspace{0.1cm} Spur \hspace{0.1cm}3)} + 5\cdot 3 \hspace{0.1cm} {\rm(Bitangabe \hspace{0.1cm} 011)} = 18\hspace{0.05cm}.$$

Einzugeben sind deshalb für die dritte Spur $N_{1} \underline{ = -8}$ und $N_{2} \underline{ = -18}.$

(5) In analoger Weise erhält man für die Spur $4$ die Werte $N_{1} \underline{ = +39}$ und $N_{2} \underline{ = -14}$.

(6) Die fünfte Spur liefert $N_{1} \underline{ =-30}$ und $N_{2} \underline{ = +5}$

@@ Zeile 3: / Zeile 3: @@
 }}
-[[Datei:P_ID1233__Bei_A_3_6.png|right|frame|Spuren des AMR-Codecs]]
+[[Datei:P_ID1233__Bei_A_3_6.png|right|frame|Spuren des AMR&ndash;Codecs]]
-Ende der 90er Jahre wurde mit dem AMR–Codec ein sehr flexibler, adaptiver Sprachcodec entwickelt und standardisiert. Dieser stellt insgesamt $8$ verschiedene Modi mit Datenraten zwischen $4.75 \ \rm kbit/s$ und $12.2 \ \rm kbit/s$ zur Verfügung.
+Ende der 1990er Jahre wurde mit dem AMR–Codec ein sehr flexibler, adaptiver Sprachcodec entwickelt und standardisiert. Dieser stellt insgesamt acht verschiedene Modi mit Datenraten zwischen&nbsp; $4.75 \ \rm kbit/s$&nbsp; und&nbsp; $12.2 \ \rm kbit/s$&nbsp; zur Verfügung.
-Der AMR-Codec beinhaltet wie der Vollraten–Codec (FRC) – siehe Aufgabe A3.5 – sowohl eine Kurzzeitprädiktion (LPC) als auch eine Langzeitprädiktion (LTP). Allerdings sind diese beiden Komponenten anders realisiert als beim FRC.
+Der AMR-Codec beinhaltet wie der in&nbsp; [[Aufgaben:Aufgabe_3.5:_GSM–Vollraten–Sprachcodec|Aufgabe 3.5]]&nbsp; behandelte Vollraten–Codec (FRC)  sowohl eine Kurzzeitprädiktion (LPC) als auch eine Langzeitprädiktion (LTP). Allerdings sind diese beiden Komponenten anders realisiert als beim FRC.
-Der wesentliche Unterschied von AMR gegenüber FRC stellt aber die Codierung des Restsignals (nach LPC und LTP) dar. Anstelle von „Regular Pulse Excitation” (RPE) wird beim AMR–Code das Verfahren „Algebraic Code Excitation Linear Prediction” (ACELP) angewendet. Aus dem festen Codebuch (FCB) wird für jeden Unterrahmen ($5 \ \rm ms$) derjenige FCB–Puls und diejenige FCB–Verstärkung ausgewählt, die am besten zum Restsignal passt, das heißt, für die der mittlere quadratische Fehler des Differenzsignals minimal wird.
+Der wesentliche Unterschied von AMR gegenüber FRC stellt die Codierung des Restsignals (nach LPC und LTP) dar:
+*Anstelle von „Regular Pulse Excitation” (RPE) wird beim AMR–Code das Verfahren „Algebraic Code Excitation Linear Prediction” (ACELP) angewendet.
+*Aus dem festen Codebuch (FCB) wird für jeden Unterrahmen von&nbsp; $5 \ \rm ms$&nbsp; Dauer derjenige FCB–Puls und diejenige FCB–Verstärkung ausgewählt, die am besten zum Restsignal passen (für die der mittlere quadratische Fehler des Differenzsignals minimal wird).
-Jeder Eintrag im festen Codebuch kennzeichnet einen Puls, bei dem genau $10$ der $40$ Positionen mit $+1$ bzw. $–1$ belegt sind. Hierzu ist zu bemerken:
-*Der Puls ist in fünf Spuren mit jeweils acht möglichen Positionen aufgeteilt, wobei die Spur $1$ die Positionen $1, 6, ... , 36$ des Unterrahmens und Spur $5$ die Positionen $5, 10, ... , 40$ beschreibt.
+Jeder Eintrag im festen Codebuch kennzeichnet einen Puls, bei dem genau&nbsp; $10$&nbsp; der&nbsp; $40$&nbsp; Positionen mit&nbsp; $\pm1$&nbsp; belegt sind. Hierzu ist anzumerken:
-*In jeder Spur sind genau zwei Werte $+1$ oder $–1$, während alle anderen sechs Werte $0$ sind. Die beiden $±1$–Positionen werden mit je drei Bit – also mit $„000”, ... , „111”$ – codiert.
+*Der Puls ist in fünf Spuren mit jeweils acht möglichen Positionen aufgeteilt, wobei die Spur&nbsp; $1$&nbsp; die Positionen&nbsp; $1,\ 6,\ 11$, ... , $36$&nbsp; des Unterrahmens und Spur&nbsp; $5$&nbsp; die Positionen&nbsp; $5,\ 10,\ 15$, ... , $40$&nbsp; beschreibt.
-*Für das Vorzeichen des erstgenannten Pulses wird ein weiteres Bit verwendet, wobei eine $„1”$ ein positives Vorzeichen und eine $„0”$ ein negatives kennzeichnet.
+*In jeder Spur sind genau zwei Werte&nbsp; $\pm1$, während alle anderen sechs Werte&nbsp; $0$&nbsp; sind. Die beiden&nbsp; $±1$–Positionen werden mit je drei Bit – also mit&nbsp; $000$, ... ,&nbsp; $111$ – codiert.
+*Für das Vorzeichen des erstgenannten Pulses wird ein weiteres Bit verwendet, wobei eine &bdquo;$1$&rdquo; ein positives Vorzeichen und eine &bdquo;$0$&rdquo; ein negatives  Vorzeichen kennzeichnet.
 *Ist die Pulsposition des zweiten Impulses größer als die des ersten Impulses, so hat der zweite Impuls das gleiche Vorzeichen wie der erste, ansonsten das umgekehrte.
-*Zum Empfänger werden somit pro Spur sieben Bit übertragen, außerdem noch fünf Bit für die FCB–Verstärkung.
+*Zum Empfänger werden somit pro Spur sieben Bit übertragen, außerdem noch fünf Bit für die so genannte&nbsp; ''FCB–Verstärkung''.
+In der Grafik sind die&nbsp; $35$&nbsp; Bit zur Beschreibung eines FCB–Pulses beispielhaft angegeben.
+'''Spur 1''' beinhaltet
+*einen positiven Impuls&nbsp; $({\rm VZ} = 1)$&nbsp; bei&nbsp; $1$&nbsp; (erste mögliche Position für Spur 1)&nbsp;  $\hspace{0.2cm}\text{plus}\hspace{0.2cm}0$ (Bitangabe für &bdquo; 000&rdquo;) $= 1$,
+*einen weiteren positiven Impuls (da $110 > 000$) bei der Position $1 \hspace{0.2cm}\text{plus}\hspace{0.2cm}5$ (Pulsabstand in jeder Spur)  $\hspace{0.2cm}\text{mal}\hspace{0.2cm}6$ (Bitangabe für &bdquo; 110&rdquo;)  = $31\hspace{0.05cm}.$
+'''Spur 2''' beinhaltet
+*einen negativen Impuls (${\rm VZ} = 0$) bei $2$ (erste mögliche Position für Spur 2)  $\hspace{0.2cm}\text{plus}\hspace{0.2cm}5\hspace{0.2cm}\text{mal}\hspace{0.2cm}4$ (Bitangabe für &bdquo; 100&rdquo;)  = $22\hspace{0.05cm},$
+*einen positiven Impuls (Vorzeichenumkehr wegen  $011 > 100$) bei der Position $2 \hspace{0.2cm}\text{plus}\hspace{0.2cm}5\hspace{0.2cm}\text{mal}\hspace{0.2cm}3$ (Bitangabe für &bdquo; 011&rdquo;)  = $17\hspace{0.05cm}.$
-In der Grafik sind die $35 \ \rm  Bits$ zur Beschreibung eines FCB–Pulses beispielhaft angegeben. In der ersten Spur erkennt man einen positiven Impuls (${\rm VZ} = 1$) bei
-:$$1 \hspace{0.1cm}{\rm(erste \hspace{0.1cm}m\ddot{o}gliche \hspace{0.1cm}Position \hspace{0.1cm}f\ddot{u}r\hspace{0.1cm} Spur \hspace{0.1cm}1)} + 0\hspace{0.1cm} {\rm(Bitangabe \hspace{0.1cm} 000)} = 1$$
-und einen weiteren positiven Impuls ($110 > 000$) bei der Position
-:$$1 +5\hspace{0.1cm}{\rm (Pulsabstand \hspace{0.1cm}in \hspace{0.1cm}jeder \hspace{0.1cm} Spur) } \cdot 6\hspace{0.1cm} {\rm(Bitangabe \hspace{0.1cm} 110)} = 31\hspace{0.05cm}.$$
-Die Spur 2 beinhaltet einen negativen Impuls (${\rm VZ} = 0$) bei
-:$$2 \hspace{0.1cm}{\rm(erste \hspace{0.1cm}m\ddot{o}gliche \hspace{0.1cm}Position \hspace{0.1cm}f\ddot{u}r\hspace{0.1cm} Spur \hspace{0.1cm}2)} + 5\cdot 4 \hspace{0.1cm} {\rm(Bitangabe \hspace{0.1cm} 100)} = 22\hspace{0.05cm}.$$
-Da $011 < 100$ ist, hat der Impuls bei der Position $2 + 5 \cdot 3$ (Bitangabe $011$) $= 17$ das umgekehrte Vorzeichen, ist also positiv. Die Angaben zu den Spuren $3, 4$ und $5$ sollen in den Teilfragen (1),(2) und (4) von Ihnen interpretiert werden.
+''Hinweise:''
-''Hinweis:''
+*Diese Aufgabe gehört zum Kapitel&nbsp; [[Beispiele_von_Nachrichtensystemen/Sprachcodierung|Sprachcodierung]].
+*Bei der Eingabe der Pulspositionen bezeichnet&nbsp; $N_{1}$&nbsp; das erste Bit–Tripel und&nbsp; $N_{2}$&nbsp; das zweite.
+*Man müsste zum Beispiel für Spur&nbsp; $2$&nbsp; die Werte&nbsp; $N_{1}=-22$&nbsp;  und&nbsp; $N_{2}=+17$&nbsp; eintragen.
-Diese Aufgabe bezieht sich auf [[Beispiele_von_Nachrichtensystemen/Sprachcodierung|Sprachcodierung]].
-'''Eingabe der Pulspositionen für die Aufgaben (4), (5), (6)''': Man müsste zum Beispiel für Spur $2$ die Werte $„–22”$ und $„+17”$ eintragen. $N_{1}$ bezeichnet das erste Bit–Tripel und $N_{2}$ das zweite.
 ===Fragebogen===
 <quiz display=simple>
-{Multiple-Choice Frage
-|type="[]"}
-- Falsch
-+ Richtig
+{Wie viele Bit beschreiben einen Sprachrahmen $($der Dauer&nbsp; $20 \ \rm ms)$&nbsp; im&nbsp; $12.2 \ \rm kbit/s$–Modus?
+|type="{}"}
+$N_{12.2} \ = \ $ { 244 3% } $ \ \rm Bit$
-{Input-Box Frage
+{Wie viele Bit werden für FCB–Puls und –Verstärkung pro Rahmen benötigt?
 |type="{}"}
-$\alpha$ = { 0.3 }
+$N_{\rm FCB} \ = \ $ { 160 3% } $ \ \rm Bit$
+{Wie viele Bit verbleiben somit für LPC und LTP?
+|type="{}"}
+$N_{\rm LPC/LTP} \ = \ $ { 84 3% } $ \ \rm Bit$
+{Welche Impulspositionen des Unterrahmens und Vorzeichen beschreibt die Spur&nbsp; $3$? <br>Beachten Sie die Hinweise zur Eingabe auf der Angabenseite.
+|type="{}"}
+$N_{1} \ = \ $ { -8.24--7.76 }
+$N_{2} \ = \ $ { -18.54--17.46 }
+{Welche Impulspositionen inklusive Vorzeichen beschreiben die Spur&nbsp; $4$?
+|type="{}"}
+$N_{1} \ = \ $ { 39 3% }
+$N_{2} \ = \ $ { -14.42--13.58 }
+{Welche Impulspositionen inklusive Vorzeichen beschreiben die Spur&nbsp; $5$?
+|type="{}"}
+$N_{1} \ = \ $ { -30.9--29.1 }
+$N_{2} \ = \ $ { 5 3% }
 </quiz>
 ===Musterlösung===
 {{ML-Kopf}}
-'''(1)'''&nbsp;
-'''(2)'''&nbsp;
+'''(1)'''&nbsp; Mit der Datenrate $12.2 \ \rm kbit/s$ ergeben sich innerhalb von $20 \ \rm ms$ genau $\underline{244 \ \rm Bit}$, während zum Beispiel im  $4.75 \ \rm kbit/s$–Modus nur $95 \ \rm Bit$ übertragen werden.
-'''(3)'''&nbsp;
-'''(4)'''&nbsp;
-'''(5)'''&nbsp;
+'''(2)'''&nbsp;  In jedem Unterrahmen benötigt der FCB–Puls $35 \ \rm Bit$ (fünf Spuren zu je sieben Bit) und die FCB–Verstärkung fünf Bit.
-'''(6)'''&nbsp;
+*Bei vier Unterrahmen kommt man so auf $N_{\rm FCB} \underline{= 160 \ \rm Bit}$.
-'''(7)'''&nbsp;
+'''(3)'''&nbsp; Hierfür verbleiben die Differenz aus (1) und (2), also $N_{\rm LPC/LTP}\underline{ = 84 \ \rm Bit}$.
+'''(4)'''&nbsp;  Das Vorzeichenbit &bdquo;$0$&rdquo; deutet auf einen negativen ersten Impuls hin.
+*Wegen $001 < 011$ hat der zweite Impuls das gleiche Vorzeichen.
+*Die beiden Beträge ergeben sich zu
+:$$|N_1| \ = \ 3 \hspace{0.1cm}{\rm(da \hspace{0.1cm} Spur \hspace{0.1cm}3)} + 5\cdot 1 \hspace{0.1cm} {\rm(Bitangabe \hspace{0.1cm} 001)} = 8\hspace{0.05cm}, $$
+:$$ |N_2| \ = \ 3 \hspace{0.1cm}{\rm(da \hspace{0.1cm} Spur \hspace{0.1cm}3)} + 5\cdot 3 \hspace{0.1cm} {\rm(Bitangabe \hspace{0.1cm} 011)} = 18\hspace{0.05cm}.$$
+*Einzugeben sind deshalb für die dritte Spur  $N_{1} \underline{ = -8}$ und $N_{2} \underline{ = -18}.$
+'''(5)'''&nbsp;  In analoger Weise erhält man für die Spur $4$ die Werte&nbsp; $N_{1} \underline{ = +39}$&nbsp; und&nbsp; $N_{2} \underline{ = -14}$.
+'''(6)'''&nbsp; Die fünfte Spur liefert&nbsp; $N_{1} \underline{ =-30}$&nbsp; und&nbsp; $N_{2} \underline{ = +5}$
 {{ML-Fuß}}