Loading [MathJax]/jax/output/HTML-CSS/fonts/TeX/fontdata.js

Aufgabe 2.2Z: Mittlere Codewortlänge

Aus LNTwww
(Weitergeleitet von 2.2Z Mittlere Codewortlänge)
Wechseln zu:Navigation, Suche

Tabelle zur Quellencodierung

Ziel von Datenkomprimierung ist es, die Nachricht einer Quelle mit möglichst wenigen Binärzeichen darzustellen.

Wir betrachten hier eine wertdiskrete Nachrichtenquelle mit dem Symbolvorrat  {A, B, C, D}   ⇒   Symbolumfang  M=4  und den Auftrittswahrscheinlichkeiten

  • pA=pB=pC=pD=1/4  (Teilaufgabe 1),
  • pA=1/2,pB=1/4,pC=pD=1/8  (ab Teilaufgabe 2).


Vorausgesetzt wird, dass es zwischen den einzelnen Quellensymbolen keine statistischen Bindungen gibt.

Ein Maß für die Güte eines Komprimierungsverfahrens ist die mittlere Codewortlänge  LM  mit der Zusatzeinheit „bit/Quellensymbol”.

Vorgegeben sind drei Zuordnungen. Anzumerken ist:

  • Jeder dieser Binärcodes  C1C2  und  C3  ist für eine spezielle Quellenstatistik ausgelegt.
  • Alle Codes sind präfixfrei und somit ohne weitere Angabe sofort decodierbar.



Hinweis:


Fragebogen

1

Bestimmen Sie die mittlere Codewortlänge  LM  für  pA=pB=pC=pD=1/4.

C1:  LM = 

 bit/Quellensymbol
C2:  LM = 

 bit/Quellensymbol
C3:  LM = 

 bit/Quellensymbol

2

Welche Werte ergeben sich für  pA=1/2,pB=1/4,pC=pD=1/8?

C1:  LM = 

 bit/Quellensymbol
C2:  LM = 

 bit/Quellensymbol
C3:  LM = 

 bit/Quellensymbol

3

Woran erkennt man präfixfreie Codes?

Kein Codewort ist der Beginn eines anderen Codewortes.
Alle Codeworte haben gleiche Länge.

4

Für die spezielle Quellensymbolfolge  ADBDCBCBADCA  ergibt sich die Codesymbolfolge  001101111001100100111000.
Welcher Code wurde verwendet?

Der Code  C1,
der Code  C2.

5

Nach Codierung mit  C3  erhält man  001101111001100100111000.  Wie lautet die zugehörige Quellensymbolfolge?

AACDBACABADAAA ...
ACBCCCACAACCD ...


Musterlösung

(1)  Die mittlere Codewortlänge ergibt sich allgemein zu

LM=pALA+pBLB+pCLC+pDLD.

Sind die vier Quellensymbole gleichwahrscheinlich  (alle Wahrscheinlichkeiten genau  1/4), so kann dafür auch geschrieben werden:

LM=1/4(LA+LB+LC+LD).
  • Code C1:    LM=2.00_ bit/Quellensymbol,
  • Code C2:    LM=2.25_ bit/Quellensymbol
  • Code C3:    LM=2.25_ bit/Quellensymbol.


(2)  Mit der Codetabelle  C1  ergibt sich unabhängig von den Symbolwahrscheinlichkeiten stets die mittlere Codewortlänge  LM=2_  bit/Quellensymbol.

Für die beiden anderen Codes erhält man:

  • Code C2:    LM=1/21+1/42+1/83+1/83=1.75_ bit/Quellensymbol,
  • Code C3:    LM=1/23+1/42+1/81+1/83=2.50_ bit/Quellensymbol.


Man erkennt aus dem Beispiel das Prinzip:

  • Wahrscheinliche Symbole werden durch wenige Binärsymbole dargestellt, unwahrscheinliche durch mehr.
  • Bei gleichwahrscheinlichen Symbolen wählt man am besten auch die Codewortlängen gleich.



(3)  Richtig ist der Lösungsvorschlag 1:

  • Der Code  C1  mit einheitlicher Länge aller Codeworte ist präfixfrei,
  • aber auch andere Codes können präfixfrei sein, zum Beispiel die Codes  C2  und  C3.


(4)  Richtig ist der Lösungsvorschlag 1:

  • Bereits aus „00” am Anfang erkennt man, dass der Code  C2  hier nicht in Frage kommt, da sonst die Quellensymbolfolge mit „AA” beginnen müsste.
  • Tatsächlich wurde der Code  C1  verwendet.


(5)  Richtig ist der Lösungsvorschlag 2:

  • Der erste Lösungsvorschlag gibt dagegen die Quellensymbolfolge für den Code  C2  an, wenn die Codesymbolfolge  001101111001100100111000  lauten würde.