Zusammenhang zwischen WDF und VTF

Zur Beschreibung von Zufallsgrößen wird neben der Wahrscheinlichkeitsdichtefunktion (WDF) auch häufig die Verteilungsfunktion (VTF) herangezogen, die wie folgt definiert ist:

Die Verteilungsfunktion $F_{\rm x}(r)$ entspricht der Wahrscheinlichkeit, dass die Zufallsgröße $x$ kleiner oder gleich einem reellen Zahlenwert $r$ ist: $$F_{x}(r) = {\rm Pr}( x \le r).$$

Die englische Bezeichnung für die Verteilungsfunktion (VTF) ist Cumulative Distribution Function (CDF).


Bei einer kontinuierlichen Zufallsgröße sind bezüglich der VTF folgende Aussagen möglich:

  • Die Verteilungsfunktion ist aus der WDF $f_{x}(x)$ durch Integration berechenbar. Es gilt:
$$F_{x}(r) = \int_{-\infty}^{r}f_x(x)\,{\rm d}x.$$
  • Da die WDF nie negativ ist, steigt $F_{x}(r)$ zumindest schwach monoton an, und liegt stets zwischen den beiden Grenzwerten $F_{x}(r → \hspace{0.05cm} – \hspace{0.05cm} ∞) = 0$ und $F_{x}(r → +∞) = 1$.
  • Umgekehrt lässt sich die Wahrscheinlichkeitsdichtefunktion aus der Verteilungsfunktion durch Differentiation bestimmen:

$$f_{x}(x)=\frac{{\rm d} F_{x}(r)}{{\rm d} r}\Bigg |_{\hspace{0.1cm}r=x}.$$

Der Zusatz $„r = x”$ macht deutlich, dass bei unserer Nomenklatur das Argument der WDF die Zufallsgröße selbst ist, während das VTF–Argument eine beliebige reelle Variable $r$ ist.


Hinweise zur Nomenklatur:

Hätten wir wie bei WDF und VTF zwischen Zufallsgröße $X$ und Realisierungen $x ∈ X$ unterschieden ⇒ $f_{X}(x), F_{X}(x),$ so ergäbe sich folgende Nomenklatur: $$F_{X}(x) = {\rm Pr}(X \le x) = \int_{-\infty}^{x}f_{x}(\xi)\,{\rm d}\xi.$$

Leider haben wir uns zu Beginn unseres LNTwww–Projektes (2001) für diese Nomenklatur entschieden, was nun (2017) nicht mehr zu ändern ist, auch im Hinblick auf die realisierten Lernvideos. Wir bleiben also bei $f_{x}(x)$ anstelle von $f_{X}(x)$ sowie $F_{x}(r)$ anstelle von $F_{X}(x).$

Verteilungsfunktion bei kontinuierlichen Zufallsgrößen

Die im letzten Abschnitt angegebenen Gleichungen gelten nur für kontinuierliche Zufallsgrößen und sollen hier durch ein Beispiel verdeutlicht werden. Im nächsten Abschnitt wird gezeigt, dass für diskrete Zufallsgrößen die Gleichungen etwas modifiziert werden müssen.


Das linke Bild zeigt das Foto Lena, das häufig als Testvorlage für Bildcodierverfahren dient.

  • Wird dieses Bild in 256 × 256 Bildpunkte (Pixel) unterteilt, und ermittelt man für jedes einzelne Pixel die Helligkeit, so erhält man eine Folge $〈x_ν〉$ von Grauwerten, deren Länge $N = 256^2 = 65536$ beträgt.
  • Der Grauwert $x$ ist dabei eine wertkontinuierliche Zufallsgröße, wobei die Zuordnung zu Zahlenwerten willkürlich erfolgt. Beispielsweise sei „Schwarz” durch den Wert $x = 0$ und „Weiß” durch $x = 1$ charakterisiert. Der Zahlenwert $x =0.5$ kennzeichnet dann eine mittlere Graufärbung.

WDF und VTF eines wertkontinuierlichen Bildes

Im mittleren Bild ist die WDF $f_{x}(x)$ dargestellt, die in der Literatur auch oft als Grauwertstatistik bezeichnet wird.

  • Es ist ersichtlich, dass im Originalbild einige Grauwerte bevorzugt sind und die beiden Extremwerte $x =0$ („tiefes Schwarz”) bzw. $x =1$ („reines Weiß”) nur sehr selten auftreten.
  • Die Verteilungsfunktion $F_{\rm x}(r)$ dieser kontinuierlichen Zufallsgröße ist stetig und steigt, wie das rechte Bild zeigt, von $0$ auf $1$ monoton und stetig an.

Anmerkung:

Genau genommen ist bei einem am Computer darstellbaren Bild – im Gegensatz zu einem „echten” Foto – der Grauwert stets eine diskrete Zufallsgröße. Bei großer Auflösung der Farbinformation („Farbtiefe”) kann man diese Zufallsgröße allerdings näherungsweise als kontinuierlich betrachten.


Die in diesem Abschnitt behandelte Thematik ist im Lernvideo Zusammenhang zwischen WDF und VTF zusammengefasst.


Verteilungsfunktion bei diskreten Zufallsgrößen

Für die Berechnung der Verteilungsfunktion einer diskreten Zufallsgröße $x$ aus deren WDF muss stets von einer etwas allgemeineren Gleichung ausgegangen werden. Hier gilt mit mit der Hilfsvariablen $\varepsilon > 0$: $$F_{x}(r)=\lim_{\varepsilon\hspace{0.05cm}\to \hspace{0.05cm}0}\int_{-\infty}^{r+\varepsilon}f_x(x)\,{\rm d}x.$$

Die Berechnung der Verteilungsfunktion durch Grenzwertbildung ist aufgrund des „≤”-Zeichens in der Definition erforderlich. Berücksichtigt man weiterhin, dass bei einer diskreten Zufallsgröße die WDF aus einer Summe von gewichteten Diracfunktionen besteht, so erhält man: $$F_{x}(r)=\lim_{\varepsilon\to 0}\int_{-\infty}^{r+\varepsilon}\sum\limits_{\mu= \rm1}^{\it M}p_\mu\cdot \delta(x-x_\mu)\,{\rm d}x.$$ Vertauscht man in dieser Gleichung Integration und Summation, und berücksichtigt man zudem, dass die Integration über die Diracfunktion die Sprungfunktion ergibt, so erhält man: $$F_{x}(r)=\sum\limits_{\mu= \rm 1}^{\it M}p_\mu\cdot \gamma_0 (r-x_\mu),\hspace{0.4cm\rm mit} \hspace{0.4cm}\gamma_0(x)=\lim_{\epsilon\to 0}\int_{-\infty}^{x+\epsilon}\delta (u)\,\rm d \it u = \left\{ \begin{array}{*{2}{c}} \rm 0 \rm falls\hspace{0.1cm}\it x< \rm 0,\\ 1 \rm falls\hspace{0.1cm}\it x\ge \rm 0. \\ \end{array} \right.$$ Hier ist zu bemerken:

  • $γ_0(x)$ unterscheidet sich von der in der Systemtheorie üblichen Sprungfunktion $γ(x)$ dadurch, dass an der Sprungstelle $x =$ 0 der rechtsseitige Grenzwert Eins gültig ist (anstelle des Mittelwertes 1/2 zwischen links- und rechtsseitigem Grenzwert).
  • Mit obiger VTF-Definition gilt dann für die Wahrscheinlichkeit von kontinuierlichen und diskreten Zufallsgrößen gleichermaßen, und natürlich auch für gemischte Zufallsgrößen mit diskreten und kontinuierlichen Anteilen:

$${\rm Pr}(x_{\rm u}<x \le x_{\rm o})=F_x(x_{\rm o})-F_x(x_{\rm u}).$$

  • Bei rein kontinuierlichen Zufallsgrößen können in dieser Gleichung das „Kleiner”–Zeichen und das „Kleiner / Gleich”–Zeichen gegenseitig ersetzt werden.

$${\rm Pr}(x_{\rm u}<x \le x_{\rm o}) ={\rm Pr}(x_{\rm u}\le x \le x_{\rm o}) ={\rm Pr}(x_{\rm u}\le x < x_{\rm o}) ={\rm Pr}(x_{\rm u}<x < x_{\rm o}).$$


Wird nun der Grauwert des Lena–Fotos mit acht Stufen quantisiert, so dass jedes einzelne Pixel durch drei Bit dargestellt und digital übertragen werden kann, so ergibt sich die diskrete Zufallsgröße $q$. Durch die Quantisierung geht allerdings ein Teil der Bildinformation verloren, was sich im quantisierten Bild durch deutlich erkennbare „Konturen” auswirkt.

WDF und VTF eines wertdiskreten Bildes

Die dazugehörige Wahrscheinlichkeitsdichtefunktion $f_{\rm q}(q)$ setzt sich aus $M =$ 8 Diracfunktionen zusammen, wobei bei der hier gewählten Quantisierung den möglichen Graustufen die Werte $q_\mu = (\mu$ – 1)/7 mit $\mu =$ 1, 2, ... , 8 zugeordnet sind. Die Gewichte der Diracfunktionen kann man aus der WDF $f_{\rm x}(x)$ des Originalbildes berechnen. Man erhält $$p_\mu=\rm Pr(\it q \rm = q_\mu \rm ) \rm = \rm Pr(\frac{2\it \mu-\rm 3}{14}< {\it x} \le\frac{2\it \mu- \rm 1}{14}) \rm = \int_{(2\it \mu- \rm 3)/14}^{(2\mu-1)/14}\it f_{\rm x}(x)\,{\rm d}x,$$

wobei für die undefinierten Randbereiche $(x$ < 0 bzw. $x$ > 1) jeweils $f_{\rm x}(x) =$ 0 zu setzen ist.

Da im Originalbild die Graustufen $x ≈$ 0 („sehr tiefes Schwarz”) bzw. $x ≈$ 1 („nahezu reines Weiß”) weitgehend fehlen, sind die Wahrscheinlichkeiten $p_1 ≈ p_8 ≈$ 0, und in der WDF sind tatsächlich nur sechs Diracfunktionen sichtbar. Die beiden fehlenden Diracfunktionen bei 0 und 1 sind in der mittleren Grafik durch Punkte markiert.

Die rechts skizzierte Verteilungsfunktion $F_{\rm q}(r)$ weist entsprechend dem oben Gesagten sechs Unstetigkeitsstellen auf, bei denen jeweils der rechtsseitige Grenzwert gültig ist.


Die in diesem Abschnitt behandelte Thematik ist im folgenden Lernvideo zusammengefasst: Zusammenhang zwischen WDF und VTF (2-teilig: Dauer 6:40 – 3:20)

Aufgaben zum Kapitel

Aufgabe 2.6:   PN-Generator der Länge 5

Aufgabe 2.6Z:   PN-Generator der Länge 3