Aufgabe 1.3: Entropienäherungen
Die Grafik rechts oben zeigt vier Symbolfolgen ⟨qν⟩ mit jeweiliger Länge N=60. Die Quellensymbole sind jeweils A und B.
- Daraus folgt direkt, dass für den Entscheidungsgehalt aller betrachteten Quellen H0=1bit/Symbol gilt.
- Die Symbole A und B treten jedoch nicht gleichwahrscheinlich auf, sondern mit den Wahrscheinlichkeiten pA und pB.
Die untere Tabelle zeigt neben H0 noch die Entropienäherungen
- H1, basierend auf pA und pB (Spalte 2),
- H2, basierend auf Zweiertupel (Spalte 3),
- H3, basierend auf Dreiertupel (Spalte 4),
- H4, basierend auf Vierertupel (Spalte 5),
- die tatsächliche Entropie H, die sich aus Hk durch den Grenzübergang für k→∞ ergibt (letzte Spalte).
Zwischen diesen Entropien bestehen folgende Größenrelationen: H≤ ... ≤H3≤H2≤H1≤H0.
- Nicht bekannt ist die Zuordnung zwischen den Quellen Q1, Q2, Q3, Q4 und den in der Grafik gezeigten gezeigten Symbolfolgen (Schwarz, Blau, Rot, Grün).
- Es ist lediglich bekannt, dass die Quelle Q4 einen Wiederholungscode beinhaltet. Aufgrund der Tatsache, dass bei der entsprechenden Symbolfolge jedes zweite Symbol keinerlei Information lierfert, ist die Entropie H=0.5bit/Symbol.
- Zudem sind die Näherungen H1=1bit/Symbol und H4≈0.789bit/Symbol gegeben.
Zu bestimmen sind für diese Nachrichtenquelle Q4 schließlich noch die Entropienäherungen H2 und H3.
Hinweise:
- Die Aufgabe gehört zum Kapitel Nachrichtenquellen mit Gedächtnis.
- Für die k–te Entropienäherung gilt bei Binärquellen (M=2) mit der Verbundwahrscheinlichkeit p(k)i eines k–Tupels:
- Hk=1k⋅2k∑i=1p(k)i⋅log21p(k)i(Einheit:bit/Symbol).
Fragebogen
Musterlösung
- da die Symbole gleichwahrscheinlich sind ⇒ H1=H0, und
- keine statistischen Bindungen zwischen den Symbolen bestehen ⇒ H= ... =H2=H1.
(2) Man erkennt bei der blauen Binärfolge, dass A sehr viel häufiger auftritt als B, so dass H1<H0 gelten muss.
- Entsprechend der Tabelle erfüllt nur die Quelle Q1_ diese Bedingung.
- Aus H1=0.5bit/Symbol kann man die Symbolwahrscheinlichkeiten pA=0.89 und pB=0.11 ermitteln.
(3) Durch Ausschlussverfahren kommt man für die rote Binärfolge zum Ergebnis Q2_:
- Die Quelle Q1 gehört nämlich zur blauen Folge, Q3 zur schwarzen und Q4 zum Wiederholungscode und damit offensichtlich zur grünen Symbolfolge.
- Die rote Symbolfolge weist folgende Eigenschaften auf:
- Wegen H1=H0 sind die Symbole gleichwahrscheinlich: pA=pB=0.5.
- Wegen H<H1 bestehen statistische Bindungen innerhalb der Folge.
- Diese erkennt man daran, dass es zwischen A und B mehr Übergänge als bei statistischer Unabhängigkeit gibt.
(4) Bei der grünen Symbolfolge (Quelle Q4) sind die Symbole A und B gleichwahrscheinlich:
- pA=pB=0.5⇒H1=1bit/Symbol.
Zur H2–Ermittlung betrachtet man Zweiertupel. Die Verbundwahrscheinlichkeiten pAA, pAB, pBA und pBB können daraus berechnet werden. Aus der Skizze erkennt man:
- Die Kombinationen AB und BA sind nur dann möglich, wenn ein Tupel bei geradzahligem ν beginnt. Für die Verbundwahrscheinlichkeiten pAB und pBA gilt dann:
- pAB=Pr(νistgerade)⋅Pr(qν=A)⋅Pr(qν+1=B|qν=A)=1/2⋅1/2⋅1/2=1/8=pBA.
- Dagegen gelten für die beiden weiteren Kombinationen AA und BB:
- pAA=Pr(ν=1)⋅Pr(q1=A)⋅Pr(q2=A|q1=A)+Pr(ν=2)⋅Pr(q2=A)⋅Pr(q3=A|q2=A).
- ⇒pAA=12⋅12⋅1+12⋅12⋅12=38=pBB.
- Hierbei steht ν=1 für alle ungeradzahligen Indizes und ν=2 für alle geradzahligen Indizes.
- Damit ergibt sich für die Entropienäherung:
- H2=12⋅[2⋅38⋅log283+2⋅18⋅log2(8)]=38⋅log2(8)−38⋅log2(3)+18⋅log2(8)=0.906bit/Symbol_.
(5) Nach ähnlichem Vorgehen kommt man bei Dreiertupeln zu den Verbundwahrscheinlichkeiten
- pAAA=pBBB=1/4,pABA=pBAB=0,pAAB=pABB=pBBA=pBAA=1/8
und daraus zur Entropienäherung
- H3=13⋅[2⋅14⋅log2(4)+4⋅18⋅log2(8)]=2.53=0.833bit/Symbol_.
Zur Berechnung von H4 ergeben sich folgende 16 Wahrscheinlichkeiten:
- pAAAA=pBBBB=3/16,pAABB=pBBAA=2/16,
- pAAAB=pABBA=pABBB=pBBBA=pBAAB=pBAAA=1/16
- pAABA=pABAA=pABAB=pBBAB=pBABB=pBABA=0.
Daraus folgt:
- H4=14⋅[2⋅316⋅log2163+2⋅18⋅log2(8)+6⋅116⋅log2(16)]=[6⋅log2(16)−6⋅log2(3)+4⋅log2(8)+6⋅log2(16)]32.
Man erkennt:
- Auch die Näherung H4=0.789bit/Symbol weicht noch deutlich vom Entropie-Endwert H=0.5bit/Symbol ab.
- Der Wiederholungscode kann offensichtlich nicht durch eine Markovquelle modelliert werden. Wäre Q4 eine Markovquelle, so müsste nämlich gelten:
- H=2⋅H2−H1⇒H2=1/2⋅(H+H1)=1/2⋅(0.5+1)=0.75bit/Symbol.