Aufgaben:Aufgabe 2.7Z: Huffman-Codierung für Zweiertupel einer Ternärquelle: Unterschied zwischen den Versionen

Version vom 29. Mai 2018, 14:02 Uhr

Wir betrachten den gleichen Sachverhalt wie in der Aufgabe A2.7: Der Huffman–Algorithmus führt zu einem besseren Ergebnis, das heißt zu einer kleineren mittleren Codewortlänge $L_{\rm M}$, wenn man ihn nicht auf einzelne Symbole anwendet, sondern vorher $k$–Tupel bildet. Dadurch erhöht man den Symbolumfang von $M$ auf $M' = M^k$.

Für die hier betrachtete Nachrichtenquelle gilt:

Symbolumfang: $M = 3$,
Symbolvorrat: $\{$X, Y, Z$\}$,
Wahrscheinlichkeiten: $p_{\rm X} = 0.7$, $p_{\rm Y} = 0.2$, $p_{\rm Z} = 0.1$,
Entropie: $H = 1.157 \ \rm bit/Ternärsymbol$.

Die Grafik zeigt den Huffman–Baum, wenn man den Huffman–Algorithmus auf Einzelsymbole anwendet, also den Fall $k= 1$. In der Teilaufgabe (2) sollen Sie den entsprechenden Huffman–Code angeben, wenn vorher Zweiertupel gebildet werden ($k=2$).

Hinweise:

Die Aufgabe gehört zum Kapitel Entropiecodierung nach Huffman.
Insbesondere wird auf die Seite Anwendung der Huffman-Codierung auf k-Tupel Bezug genommen.
Eine vergleichbare Aufgabenstellung mit binären Eingangssymbolen wird in der Aufgabe 2.7 behandelt.
Bezeichnen Sie die möglichen Zweiertupel mit XX = A, XY = B, XZ = C, YX = D, YY = E, YZ = F, ZX = G, ZY = H, ZZ = I .

Fragebogen

$k= 1\text{:} \hspace{0.25cm}L_{\rm M} \ = \ $

$\ \rm bit/Quellensymbol$

$p_{\rm A} = {\rm Pr}($XX$)\ = \ $

$p_{\rm B} = {\rm Pr}($XY$)\ = \ $

$p_{\rm C} = {\rm Pr}($XZ$)\ = \ $

$k= 2\text{:} \hspace{0.25cm}L_{\rm M} \ = \ $

$\ \rm bit/Quellensymbol$

	$L_{\rm M}$ fällt monoton mit steigendem $k$ ab.
	$L_{\rm M} $ändert sich nicht, wenn man $k$ erhöht.
	Für $k= 3$ erhält man $L_{\rm M} = 1.05 \ \rm bit/Quellensymbol$.

Musterlösung

(1) Die mittlere Codewortlänge ergibt sich mit p_X = 0.7, L_X = 1, p_Y = 0.2, L_Y = 2, p_Z = 0.1, L_Z = 2 zu

$$L_{\rm M} = p_{\rm X} \cdot 1 + (p_{\rm Y} + p_{\rm Z}) \cdot 2 \hspace{0.15cm}\underline{= 1.3\,\,{\rm bit/Quellensymbol}}\hspace{0.05cm}. $$

Dieser Wert liegt noch deutlich über der Quellenentropie H = 1.157 bit/Quellensymbol.

(2) Es gibt M′ = M² = 3² = 9 Zweiertupel mit folgenden Wahrscheinlichkeiten:

p_A = Pr(XX) = 0.49, p_B = Pr(XY) = 0.14, p_C = Pr(XZ) = 0.07,

p_D = Pr(YX) = 0.14, p_E = Pr(YY) = 0.04, p_F = Pr(YZ) = 0.02,

p_G = Pr(YX) = 0.07, p_H = Pr(YY) = 0.02, p_I = Pr(YZ) = 0.01.

(3) Die Grafik zeigt den Huffman–Baum für die Anwendung mit k = 2.

Damit erhält man

für die einzelnen Zweiertupels folgende Binärcodierungen:

XX = A → 0, XY = B → 111, XZ = C → 1011, YX = D → 110, YY = E → 1000,

YZ = F → 10010, ZX = G → 1010, ZY = H → 100111, ZZ = I → 100110 .

für die mittlere Codewortlänge:

$$L_{\rm M}' =0.49 \cdot 1 + (0.14 + 0.14) \cdot 3 + (0.07 + 0.04 + 0.07) \cdot 4 + 0.02 \cdot 5 + (0.02 + 0.01) \cdot 6 = 2.33\,\,{\rm bit/Zweiertupel}$$

$$\Rightarrow\hspace{0.3cm}L_{\rm M} = {L_{\rm M}'}/{2}\hspace{0.15cm}\underline{ = 1.165\,\,{\rm bit/Quellensymbol}}\hspace{0.05cm}.$$

(4) Richtig ist Aussage 1, auch wenn L_M mit wachsendem k nur sehr langsam abfällt.

Die letzte Aussage ist falsch, da L_M auch für k → ∞ nicht kleiner sein kann als H = 1.157 bit/Quellensymbol.
Aber auch die zweite Aussage ist nicht unbedingt richtig: Da mit k = 2 weiterhin L_M > H gilt, kann k = 3 zu einer weiteren Verbesserung führen.

@@ Zeile 21: / Zeile 21: @@
 *Eine vergleichbare Aufgabenstellung mit binären Eingangssymbolen wird in der   [[Aufgaben:2.7_Huffman-Anwendung_für_binäre_Zweiertupel|Aufgabe 2.7]] behandelt.
 *Bezeichnen Sie die möglichen Zweiertupel mit &nbsp; &nbsp; <b>XX</b> = <b>A</b>,&nbsp;&nbsp;<b>XY</b> = <b>B</b>,&nbsp;&nbsp;<b>XZ</b> = <b>C</b>,&nbsp;&nbsp; <b>YX</b> = <b>D</b>,&nbsp;&nbsp;<b>YY</b> = <b>E</b>,&nbsp;&nbsp;<b>YZ</b> = <b>F</b>,&nbsp;&nbsp;<b>ZX</b> = <b>G</b>,&nbsp;&nbsp;<b>ZY</b> = <b>H</b>,&nbsp;&nbsp;<b>ZZ</b> = <b>I</b> .
-*Sollte die Eingabe des Zahlenwertes &bdquo;0&rdquo; erforderlich sein, so geben Sie bitte &bdquo;0.&rdquo; ein.