Herzlich willkommen zu "Kompression - Die Zweite"!
Nicht erschrecken, das hier ist kein Englischunterricht, sondern die aktuelle (zum Zeitpunkt der Rätseleinstellung) Single von Nelly Furtado.
Mit obenstehendem Text soll nun etwas gemacht werden:
Komprimiere den Lied-Text (Strophe 1, Refrain und Strophe2) auf so wenige Bits ("0" und "1") wie möglich!
Hierzu folgende Regel und etwas Hintergrundwissen:
Normalerweise wird ein Text unkomprimiert abgespeichert. Jedes Zeichen (egal ob Buchstabe (klein und groß), Ziffern, Leerzeichen, Satzzeichen,
Sonderzeichen etc.) wird mit 8 Bit codiert (somit gibt es maximal 256 verschiedene Darstellungsmöglichkeiten, nämlich von "00000000" bis "11111111".
Auch das "Enter-Zeichen", mit dem eine neue Zeile eingeleitet wird, ist ein solches Zeichen!
Wenn man nach (alter) Methode den Text abspeichert, benötigt man 7.888 Bit = 986 Byte an Festplatten-Kapazität (das "====" soll jeweils nur eine neue Zeile symbolisieren).
Ihr sollt nun eine Methode finden, durch die man weniger als 3/4 an Platz benötigt (kleiner-gleich 5.916 Bit).
Ich lasse alle Lösungen als richtig gelten, wenn der Ansatz stimmt (bitte Lösungsschema sowie die Anzahl der Bits angeben) und ihr auf unter 75 Prozent des Nominalwertes kommt.
Was nicht erlaubt ist: Einfach die Zeichenlänge von 8 Bit auf z.B. 6 Bit pauschal zu verkürzen, denn dann wären ja einige Sonderzeichen, die zwar in diesem speziellen Text nicht vorkommen,
aber trotzdem immer noch "möglich" sein müssen, nicht mehr darstellbar!!!
Das heißt also im Klartext, mit eurer Methode soll DIESER spezielle Text besonders gut komprimierbar sein,
es soll aber auch JEDER andere Text mit bis zu 256 verschiedenen Zeichen ebenfalls darstellbar sein (dann eben bloß nicht mehr so gut optimiert).
Als Lösung hätte ich gerne:
Nunn denn, viel Spaß beim Grübeln!