Aufgabe 3.7: Einige Entropieberechnungen
Wir betrachten die beiden Zufallsgrößen $XY$ und $UV$ mit den folgenden 2D-Wahrscheinlichkeitsfunktionen:
$$P_{XY}(X, Y) = \begin{pmatrix} 0.18 & 0.16\\ 0.02 & 0.64 \end{pmatrix}\hspace{0.05cm} \hspace{0.05cm}$$
$$P_{UV}(U, V) \hspace{0.05cm}= \begin{pmatrix} 0.068 & 0.132\\ 0.272 & 0.528 \end{pmatrix}\hspace{0.05cm}$$
Für die Zufallsgröße $XY$sollen in dieser Aufgabe berechnet werden:
- die Verbundentropie (englisch: Joint Entropy):
$H(XY) = -E[log_2 P_{ XY }( X,Y)]$
- die beiden Einzelentropien:
$$H(X) = -E[log_2 P_X( X)]$$ $$H(Y) = -E[log_2 P_Y( Y)]$$ Daraus lassen sich entsprechend dem obigen Schema – dargestellt für die Zufallsgröße $XY$ – noch die folgenden Beschreibungsgrößen sehr einfach bestimmen:
- die bedingten Entropien (englisch: Conditional Entropies):
$H(X \mid Y) = -E[log_2 P_{ X \mid Y }( X \mid Y)]$
$H(Y \mid Y) = -E[log_2 P_{ Y \mid X }( Y \mid X)]$
- die Transinformation (englisch: Mutual Information) zwischen $X$ und $Y$:
$I(X;Y) = E [log_2 \frac{P_{ XY }(X,Y)}{P_X(X) . P_Y(Y)}]$
Abschließend sind qualitative Aussagen hinsichtlich der zweiten Zufallsgröße $UV$ zu verifizieren.
Hinweise:
- Die Aufgabe gehört zum Kapitel Einige Vorbemerkungen zu den 2D-Zufallsgrößen.
- Insbesondere wird Bezug genommen auf die Seite Relative Entropie – Kullback-Leibler-Distanz.
- Sollte die Eingabe des Zahlenwertes „0” erforderlich sein, so geben Sie bitte „0.” ein.
- Die beiden Wahrscheinlichkeitsfunktionen können aus obiger Grafik wie folgt abgelesen werden:
- $$P_X(X) = [1/4 , 1/2 , 1/4],\hspace{0.5cm} Q_X(X) = [1/8 , 3/4, 1/8].$$
Hinwies: Die Aufgabe bezieht sich auf das Themengebiet von Kapitel 3.2.
Fragebogen
Musterlösung
1. Aus der gegebenen Verbundwahrscheinlichkeit erhält man
$$H(XY) = 0,18 . log_2 \frac{1}{0,18} + 0,16 . log_2 \frac{1}{0,16}$$
$$+ 0,02 . log_2 \frac{1}{0,02} + 0,64 . log_2 \frac{1}{0,64} = 1,393 (bit)$$
2. Die 1D–Wahrscheinlichkeitsfunktionen lauten $P_X(X) = [0.2, 0.8]$ und $P_Y(Y) = [0.34, 0.66]$. Daraus folgt:
$H(X) = 0,2 . log_2 \frac{1}{0.2} + 0,8 . log_2 \frac{1}{0,8} = 0.722 (bit)$
$H(Y) = 0,34 . log_2 \frac{1}{0.34} + 0,66 . log_2 \frac{1}{0,66} = 0.925 (bit)$
3. Aus der $Grafik$ auf der Angabenseite erkennt man den Zusammenhang:
$$I(X;Y) = H(X) + H(Y) - H(XY) = $$ $$ = 0.722 (bit) + 0.925 (bit)- 1.393 (bit) = 0.254 (bit)$$
4. Ebenso gilt entsprechend der $Grafik$ auf der Angabenseite:
$$H(X \mid Y) = H(XY) - H(Y) = 1.393 - 0.925 = 0.468 (bit)$$ $$H(Y \mid X) = H(XY) - H(X) = 1.393 - 0.722 = 0.671 (bit)$$
Die linke Grafik fasst die Ergebnisse der Teilaufgaben (a), ... , (d) maßstabsgetreu zusammen. Grau hinterlegt ist die Verbundentropie und gelb die Transinformation. Eine rote Hinterlegung bezieht sich auf die Zufallsgröße $X$, eine grüne auf $Y$. Schraffierte Felder deuten auf eine bedingte Entropie hin.
Die rechte Grafik beschreibt den gleichen Sachverhalt für die Zufallsgröße $UV \Rightarrow$ Teilaufgabe (e).
5. Man erkennt die Gültigkeit von $P_{ UV } (.) = P_U (⋅) · P_V(⋅) \Rightarrow$ Transinformation $I(U; V) = 0$ daran, dass die zweite Zeile der $P_{ UV }$–Matrix sich von der ersten Zeile nur durch einen konstanten Faktor (4) unterscheidet. Richtig sind demzufolge die Aussagen 1, 2 und 4. Weiter ist zu erwähnen:
- Es ergeben sich die gleichen 1D–Wahrscheinlichkeitsfunktiionen wie für die Zufallsgröße $XY \Rightarrow P_U(U) = [0.2, 0.8]$ und $P_V(V) = [0.34, 0.66]$.
- Deshalb ist auch $H(U) = H(X) = 0.722$ bit und $H(V) = H(Y) = 0.925 bit$.
- Hier gilt aber nun für die Verbundentropie: $H(UV) = H(U) + H(V) ≠ H(XY)$.