WDF, VTF und Momente spezieller Verteilungen (Applet)

Inhaltsverzeichnis

1 Programmbeschreibung
2 Theoretischer Hintergrund
3 Versuchsdurchführung
4 Zur Handhabung des Applets
5 Über die Autoren
6 Nochmalige Aufrufmöglichkeit des Applets in neuem Fenster

Programmbeschreibung

WDF, VTF und Momente spezieller Verteilungen Das Applet verdeutlicht die Eigenschaften zweidimensionaler Gaußscher Zufallsgrößen $XY\hspace{-0.1cm}$, gekennzeichnet durch die Standardabweichungen (Streuungen) $\sigma_X$ und $\sigma_Y$ ihrer beiden Komponenten sowie den Korrelationskoeffizienten $\rho_{XY}$ zwischen diesen. Die Komponenten werden als mittelwertfrei vorausgesetzt: $m_X = m_Y = 0$.

Das Applet zeigt

die zweidimensionale Wahrscheinlichkeitsdichtefunktion ⇒ $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$ $f_{XY}(x, \hspace{0.1cm}y)$ in dreidimensionaler Darstellung sowie in Form von Höhenlinien,
die zugehörigen Randwahrscheinlichkeitsdichtefunktionen $f_{X}(x)$ und $f_{Y}(y)$ ⇒ $\rm 1D\hspace{-0.1cm}-\hspace{-0.1cm}WDFs$,
die zweidimensionale Verteilungsfunktion ⇒ $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$ $F_{XY}(x, \hspace{0.1cm}y)$ als 3D-Plot.

Das Applet verwendet das Framework Plot.ly

Theoretischer Hintergrund

Verbundwahrscheinlichkeitsdichtefunktion ⇒ 2D–WDF

Wir betrachten zwei wertkontinuierliche Zufallsgrößen $X$ und $Y\hspace{-0.1cm}$, zwischen denen statistische Abhängigkeiten bestehen können. Zur Beschreibung der Wechselbeziehungen zwischen diesen Größen ist es zweckmäßig, die beiden Komponenten zu einer zweidimensionalen Zufallsgröße $XY =(X, Y)$ zusammenzufassen. Dann gilt:

$\text{Definition:}$ Die Verbundwahrscheinlichkeitsdichtefunktion ist die Wahrscheinlichkeitsdichtefunktion (WDF, englisch: Probability Density Function, kurz: PDF) der zweidimensionalen Zufallsgröße $XY$ an der Stelle $(x, y)$:

$$f_{XY}(x, \hspace{0.1cm}y) = \lim_{\left.{\Delta x\rightarrow 0 \atop {\Delta y\rightarrow 0} }\right.}\frac{ {\rm Pr}\big [ (x - {\rm \Delta} x/{\rm 2} \le X \le x + {\rm \Delta} x/{\rm 2}) \cap (y - {\rm \Delta} y/{\rm 2} \le Y \le y +{\rm \Delta}y/{\rm 2}) \big] }{ {\rm \Delta} \ x\cdot{\rm \Delta} y}.$$

Die Verbundwahrscheinlichkeitsdichtefunktion oder kurz $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$ ist eine Erweiterung der eindimensionalen WDF.
$∩$ kennzeichnet die logische UND-Verknüpfung.
$X$ und $Y$ bezeichnen die beiden Zufallsgrößen, und $x \in X$ sowie $y \in Y$ geben Realisierungen hiervon an.
Die für dieses Applet verwendete Nomenklatur unterscheidet sich also geringfügig gegenüber der Beschreibung im Theorieteil.

Anhand dieser 2D–WDF $f_{XY}(x, y)$ werden auch statistische Abhängigkeiten innerhalb der zweidimensionalen Zufallsgröße $XY$ vollständig erfasst im Gegensatz zu den beiden eindimensionalen Dichtefunktionen ⇒ Randwahrscheinlichkeitsdichtefunktionen:

$$f_{X}(x) = \int _{-\infty}^{+\infty} f_{XY}(x,y) \,\,{\rm d}y ,$$

$$f_{Y}(y) = \int_{-\infty}^{+\infty} f_{XY}(x,y) \,\,{\rm d}x .$$

Diese beiden Randdichtefunktionen $f_X(x)$ und $f_Y(y)$

liefern lediglich statistische Aussagen über die Einzelkomponenten $X$ bzw. $Y$,
nicht jedoch über die Bindungen zwischen diesen.

Als quantitatives Maß für die linearen statistischen Bindungen ⇒ Korrelation verwendet man

die Kovarianz $\mu_{XY}$, die bei mittelwertfreien Komponenten gleich dem gemeinsamen linearen Moment erster Ordnung ist:

$$\mu_{XY} = {\rm E}\big[X \cdot Y\big] = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} X \cdot Y \cdot f_{XY}(x,y) \,{\rm d}x \, {\rm d}y ,$$

den Korrelationskoeffizienten nach Normierung auf die beiden Effektivwerte $σ_X$ und $σ_Y$ der beiden Komponenten:

$$\rho_{XY}=\frac{\mu_{XY} }{\sigma_X \cdot \sigma_Y}.$$

$\text{Eigenschaften des Korrelationskoeffizienten:}$

Aufgrund der Normierung gilt stets $-1 \le ρ_{XY} ≤ +1$.
Sind die beiden Zufallsgrößen $X$ und $Y$ unkorreliert, so ist $ρ_{XY} = 0$.
Bei strenger linearer Abhängigkeit zwischen $X$ und $Y$ ist $ρ_{XY}= ±1$ ⇒ vollständige Korrelation.
Ein positiver Korrelationskoeffizient bedeutet, dass bei größerem $X$–Wert im statistischen Mittel auch $Y$ größer ist als bei kleinerem $X$.
Dagegen drückt ein negativer Korrelationskoeffizient aus, dass $Y$ mit steigendem $X$ im Mittel kleiner wird.

Höhenlinien bei unkorrelierten Zufallsgrößen

Höhenlinien der 2D-WDF bei unkorrelierten Größen

Aus der Bedingungsgleichung $f_{XY}(x, y) = {\rm const.}$ können die Höhenlinien der WDF berechnet werden.

Sind die Komponenten $X$ und $Y$ unkorreliert $(ρ_{XY} = 0)$, so erhält man als Gleichung für die Höhenlinien:

$$\frac{x^{\rm 2}}{\sigma_{X}^{\rm 2}}+\frac{y^{\rm 2}}{\sigma_{Y}^{\rm 2}} =\rm const.$$

Die Höhenlinien beschreiben in diesem Fall folgende Figuren:

Kreise (falls $σ_X = σ_Y$, grüne Kurve), oder
Ellipsen (für $σ_X ≠ σ_Y$, blaue Kurve) in Ausrichtung der beiden Achsen.

Korrelationsgerade

Als Korrelationsgerade bezeichnet man die Gerade $y = K(x)$ in der $(x, y)$–Ebene durch den „Mittelpunkt” $(m_X, m_Y)$. Diese besitzt folgende Eigenschaften:

Gaußsche 2D-WDF (Approximation mit $N$ Messpunkten) und
Korrelationsgerade $y = K(x)$

Die mittlere quadratische Abweichung von dieser Geraden – in $y$–Richtung betrachtet und über alle $N$ Messpunkte gemittelt – ist minimal:

$$\overline{\varepsilon_y^{\rm 2} }=\frac{\rm 1}{N} \cdot \sum_{\nu=\rm 1}^{N}\; \;\big [y_\nu - K(x_{\nu})\big ]^{\rm 2}={\rm Minimum}.$$

Die Korrelationsgerade kann als eine Art „statistische Symmetrieachse“ interpretiert werden. Die Geradengleichung lautet im allgemeinen Fall:

$$y=K(x)=\frac{\sigma_Y}{\sigma_X}\cdot\rho_{XY}\cdot(x - m_X)+m_Y.$$

Der Winkel, den die Korrelationsgerade zur $x$–Achse einnimmt, beträgt:

$$\theta={\rm arctan}(\frac{\sigma_{Y} }{\sigma_{X} }\cdot \rho_{XY}).$$

Höhenlinien bei korrelierten Zufallsgrößen

Bei korrelierten Komponenten $(ρ_{XY} ≠ 0)$ sind die Höhenlinien der WDF (fast) immer elliptisch, also auch für den Sonderfall $σ_X = σ_Y$.

Ausnahme: $ρ_{XY}=\pm 1$ ⇒ Diracwand; siehe Aufgabe 4.4 im Buch „Stochastische Signaltheorie”, Teilaufgabe (5).

Höhenlinien der 2D-WDF bei korrelierten Größen

Hier lautet die Bestimmungsgleichung der WDF-Höhenlinien:

$$f_{XY}(x, y) = {\rm const.} \hspace{0.5cm} \Rightarrow \hspace{0.5cm} \frac{x^{\rm 2} }{\sigma_{X}^{\rm 2}}+\frac{y^{\rm 2} }{\sigma_{Y}^{\rm 2} }-{\rm 2}\cdot\rho_{XY}\cdot\frac{x\cdot y}{\sigma_X\cdot \sigma_Y}={\rm const.}$$

Die Grafik zeigt in hellerem Blau für zwei unterschiedliche Parametersätze je eine Höhenlinie.

Die Ellipsenhauptachse ist dunkelblau gestrichelt.
Die Korrelationsgerade $K(x)$ ist durchgehend rot eingezeichnet.

Anhand dieser Darstellung sind folgende Aussagen möglich:

Die Ellipsenform hängt außer vom Korrelationskoeffizienten $ρ_{XY}$ auch vom Verhältnis der beiden Streuungen $σ_X$ und $σ_Y$ ab.
Der Neigungswinkel $α$ der Ellipsenhauptachse (gestrichelte Gerade) gegenüber der $x$–Achse hängt ebenfalls von $σ_X$, $σ_Y$ und $ρ_{XY}$ ab:

$$\alpha = {1}/{2} \cdot {\rm arctan } \big ( 2 \cdot \rho_{XY} \cdot \frac {\sigma_X \cdot \sigma_Y}{\sigma_X^2 - \sigma_Y^2} \big ).$$

Die (rote) Korrelationsgerade $y = K(x)$ einer Gaußschen 2D–Zufallsgröße liegt stets unterhalb der (blau gestrichelten) Ellipsenhauptachse.
$K(x)$ kann aus dem Schnittpunkt der Höhenlinien und ihrer vertikalen Tangenten geometrisch konstruiert werden, wie in der Skizze in grüner Farbe angedeutet.

Zweidimensionale Verteilungsfunktion ⇒ 2D–VTF

$\text{Definition:}$ Die 2D-Verteilungsfunktion ist ebenso wie die 2D-WDF lediglich eine sinnvolle Erweiterung der eindimensionalen Verteilungsfunktion (VTF):

$$F_{XY}(x,y) = {\rm Pr}\big [(X \le x) \cap (Y \le y) \big ] .$$

Es ergeben sich folgende Gemeinsamkeiten und Unterschiede zwischen der „1D-VTF” und der„ 2D-VTF”:

Der Funktionalzusammenhang zwischen „2D–WDF” und „2D–VTF” ist wie im eindimensionalen Fall durch die Integration gegeben, aber nun in zwei Dimensionen. Bei kontinuierlichen Zufallsgrößen gilt:

$$F_{XY}(x,y)=\int_{-\infty}^{y} \int_{-\infty}^{x} f_{XY}(\xi,\eta) \,\,{\rm d}\xi \,\, {\rm d}\eta .$$

Umgekehrt lässt sich die Wahrscheinlichkeitsdichtefunktion aus der Verteilungsfunktion durch partielle Differentiation nach $x$ und $y$ angeben:

$$f_{XY}(x,y)=\frac{{\rm d}^{\rm 2} F_{XY}(\xi,\eta)}{{\rm d} \xi \,\, {\rm d} \eta}\Bigg|_{\left.{x=\xi \atop {y=\eta}}\right.}.$$

Bezüglich der Verteilungsfunktion $F_{XY}(x, y)$ gelten folgende Grenzwerte:

$$F_{XY}(-\infty,\ -\infty) = 0,\hspace{0.5cm}F_{XY}(x,\ +\infty)=F_{X}(x ),\hspace{0.5cm} F_{XY}(+\infty,\ y)=F_{Y}(y ) ,\hspace{0.5cm}F_{XY}(+\infty,\ +\infty) = 1.$$

Im Grenzfall $($unendlich große $x$ und $y)$ ergibt sich demnach für die „2D-VTF” der Wert $1$. Daraus erhält man die Normierungsbedingung für die 2D-Wahrscheinlichkeitsdichtefunktion:

$$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f_{XY}(x,y) \,\,{\rm d}x \,\,{\rm d}y=1 . $$

$\text{Fazit:}$ Beachten Sie den signifikanten Unterschied zwischen eindimensionalen und zweidimensionalen Zufallsgrößen:

Bei eindimensionalen Zufallsgrößen ergibt die Fläche unter der WDF stets den Wert $1$.
Bei zweidimensionalen Zufallsgrößen ist das WDF-Volumen immer gleich $1$.

Versuchsdurchführung

Wählen Sie zunächst die Nummer (1, ...) der zu bearbeitenden Aufgabe.
Eine Aufgabenbeschreibung wird angezeigt. Die Parameterwerte sind angepasst.
Lösung nach Drücken von „Musterlösung”.
Bei der Aufgabenbeschreibung verwenden wir $\rho$ anstelle von $\rho_{XY}$.
Für die „1D-WDF” gilt: $f_{X}(x) = \sqrt{1/(2\pi \cdot \sigma_X^2)} \cdot {\rm e}^{-x^2/(2 \hspace{0.05cm}\cdot \hspace{0.05cm} \sigma_X^2)}$.

Die Nummer 0 entspricht einem „Reset”:

Gleiche Einstellung wie beim Programmstart.
Ausgabe eines „Reset–Textes” mit weiteren Erläuterungen zum Applet.

(1) Machen Sie sich anhand der Voreinstellung $(\sigma_X=1, \ \sigma_Y=0.5, \ \rho = 0.7)$ mit dem Programm vertraut. Interpretieren Sie die Grafiken für $\rm WDF$ und $\rm VTF$.

$\rm WDF$ ist ein Bergrücken mit dem Maximum bei $x = 0, \ y = 0$. Der Bergkamm ist leicht verdreht gegenüber der $x$–Achse.
$\rm VTF$ ergibt sich aus $\rm WDF$ durch fortlaufende Integration in beide Richtungen. Das Maximum $($nahezu $1)$ tritt bei $x=3, \ y=3$ auf.

(2) Nun lautet die Einstellung $\sigma_X= \sigma_Y=1, \ \rho = 0$. Welche Werte ergeben sich für $f_{XY}(0,\ 0)$ und $F_{XY}(0,\ 0)$? Interpretieren Sie die Ergebnisse.

Das WDF–Maximum ist $f_{XY}(0,\ 0) = 1/(2\pi)= 0.1592$, wegen $\sigma_X= \sigma_Y = 1, \ \rho = 0$. Die Höhenlinien sind Kreise.
Für den VTF-Wert gilt: $F_{XY}(0,\ 0) = [{\rm Pr}(X \le 0)] \cdot [{\rm Pr}(Y \le 0)] = 0.25$. Geringfügige Abweichung wegen numerischer Integration.

(3) Es gelten weiter die Einstellungen von (2). Welche Werte ergeben sich für $f_{XY}(0,\ 1)$ und $F_{XY}(0,\ 1)$? Interpretieren Sie die Ergebnisse.

Es gilt $f_{XY}(0,\ 1) = f_{X}(0) \cdot f_{Y}(1) = [ \sqrt{1/(2\pi)}] \cdot [\sqrt{1/(2\pi)} \cdot {\rm e}^{-0.5}] = 1/(2\pi) \cdot {\rm e}^{-0.5} = 0.0965$.
Das Programm liefert $F_{XY}(0,\ 1) = [{\rm Pr}(X \le 0)] \cdot [{\rm Pr}(Y \le 1)] = 0.4187$, also einen größeren Wert als in (2), da weiter integriert wird.

(4) Die Einstellungen bleiben erhalten. Welche Werte ergeben sich für $f_{XY}(1,\ 0)$ und $F_{XY}(1,\ 0)$? Interpretieren Sie die Ergebnisse.

Aufgrund der Rotationssysmmetrie gleiche Ergebnisse wie in (3).

(5) Stimmt die Aussage: „Elliptische Höhenlinien gibt es nur für $\rho \ne 0$”. Interpretieren Sie die $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$ und $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$ für $\sigma_X=1, \ \sigma_Y=0.5$ und $\rho = 0$.

Nein! Auch für $\ \rho = 0$ sind die Höhenlinien elliptisch (nicht kreisförmig), falls $\sigma_X \ne \sigma_Y$.
Für $\sigma_X \gg \sigma_Y$ hat die $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$ die Form eines langgestreckten Bergkamms parallel zur $x$–Achse, für $\sigma_X \ll \sigma_Y$ parallel zur $y$–Achse.
Für $\sigma_X \gg \sigma_Y$ ist der Anstieg der $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$ in Richtung der $y$–Achse deutlich steiler als in Richtung der $x$–Achse.

(6) Variieren Sie ausgehend von $\sigma_X=\sigma_Y=1, \ \rho = 0.7$ den Korrelationskoeffizienten $\rho$. Wie groß ist der Neigungswinkel $\alpha$ der Ellipsen–Hauptachse?

Für $\rho > 0$ ist $\alpha = 45^\circ$ und für $\rho < 0$ ist $\alpha = -45^\circ$. Für $\rho = 0$ sind die Höhenlinien kreisfömig und somit gibt es auch keine Ellipsen–Hauptachse.

(7) Variieren Sie ausgehend von $\sigma_X=\sigma_Y=1, \ \rho = 0.7$ den Korrelationskoeffizienten $\rho > 0$. Wie groß ist der Neigungswinkel $\theta$ der Korrelationsgeraden $K(x)$?

Für $\sigma_X=\sigma_Y$ ist $\theta={\rm arctan}\ (\rho)$. Die Steigung nimmt mit wachsendem $\rho > 0$ zu. In allen Fällen gilt $\theta < \alpha = 45^\circ$. Für $\rho = 0.7$ ergibt sich $\theta = 35^\circ$.

(8) Variieren Sie ausgehend von $\sigma_X=\sigma_Y=0.75, \ \rho = 0.7$ die Parameter $\sigma_Y$ und $\rho \ (>0)$. Welche Aussagen gelten für die Winkel $\alpha$ und $\theta$?

Für $\sigma_Y<\sigma_X$ ist $\alpha < 45^\circ$ und für $\sigma_Y>\sigma_X$ dagegen $\alpha > 45^\circ$.
Bei allen Einstellungen gilt: Die Korrelationsgerade liegt unter der Ellipsen–Hauptachse.

(9) Gehen Sie von $\sigma_X= 1, \ \sigma_Y=0.75, \ \rho = 0.7$ aus und variieren Sie $\rho$. Wie könnte man die Korrelationsgerade aus den Höhenlinien konstruieren?

Die Korrelationsgerade schneidet alle Höhenlinien an den Punkten, an denen die Tangente zu der Höhenlinie senkrecht verläuft.

(10) Nun gelte $\sigma_X= \sigma_Y=1, \ \rho = 0.95$. Interpretieren Sie die $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$. Welche Aussagen würden für den Grenzfall $\rho \to 1$ zutreffen?

Die $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$ hat nur Anteile in der Nähe der Ellipsen–Hauptachse. Die Korrelationsgerade liegt nur knapp darunter: $\alpha = 45^\circ, \ \theta = 43.5^\circ$.
Im Grenzfall $\rho \to 1$ wäre $\theta = \alpha = 45^\circ$. Außerhalb der Korrelationsgeraden hätte die $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$ keine Anteile. Das heißt:
Längs der Korrelationsgeraden ergäbe sich eine Diracwand ⇒ Alle Werte sind unendlich groß, trotzdem um den Mittelwert gaußisch gewichtet.

Zur Handhabung des Applets

(A) Parametereingabe per Slider: $\sigma_X$, $\sigma_Y$ und $\rho$

(B) Auswahl: Darstellung von WDF oder VTF

(C) Reset: Einstellung wie beim Programmstart

(D) Höhenlinien darstellen anstelle von „1D-WDF”

(E) Darstellungsbereich für „2D-WDF”

(F) Manipulation der 3D-Grafik (Zoom, Drehen, ...)

(G) Darstellungsbereich für „1D-WDF” bzw. „Höhenlinien”

(H) Manipulation der 2D-Grafik („1D-WDF”)

( I ) Bereich für die Versuchsdurchführung: Aufgabenauswahl

(J) Bereich für die Versuchsdurchführung: Aufgabenstellung

( L) Bereich für die Versuchsdurchführung: Musterlösung

Werte–Ausgabe über Maussteuerung (sowohl bei 2D als auch bei 3D)

Über die Autoren

Dieses interaktive Berechnungstool wurde am Lehrstuhl für Nachrichtentechnik der Technischen Universität München konzipiert und realisiert.

Die erste Version wurde 2003 von Ji Li im Rahmen ihrer Diplomarbeit mit „FlashMX–Actionscript” erstellt (Betreuer: Günter Söder).
2019 wurde das Programm von Carolin Mirschina im Rahmen einer Werkstudententätigkeit auf „HTML5” umgesetzt und neu gestaltet (Betreuer: Tasnád Kernetzky).

Die Umsetzung dieses Applets auf HTML 5 wurde durch Studienzuschüsse der Fakultät EI der TU München finanziell unterstützt. Wir bedanken uns.

Nochmalige Aufrufmöglichkeit des Applets in neuem Fenster

Applet in neuem Tab öffnen