Datentypen

1 Standard-Datentypen

1.1 Variablen-Deklaration - wieso denn das?
1.2 Bisher bekannte Datentypen
1.3 Der kleinste mögliche Datentyp: Boolean
1.4 Typumwandlungen

1.1 Variablen-Deklaration - wieso denn das?

Pascal, Java, C, all das sind "typ-strenge" Sprachen, d.h.: jede Variable muss vor ihrer ersten Verwendung im Programm "deklariert" werden. Dies ist durchaus nicht in allen Programmiersprachen so, und manche Hobby-Programmierer sehnen sich beim ersten Kontakt mit einer typ-strengen Sprache nach dem Komfort vieler "Basic"-Dialekte zurück, bei denen man eine Variable im Programm verwenden kann, ohne dies in irgend einer Weise vorbereitet zu haben. Wozu ist dieser Aufwand in den "ernsthaften" Programmiersprachen eigentlich nötig?

Wenn Variablen im Speicher abgelegt werden, geschieht dies so, dass an die zugehörige Speicherstelle ein bestimmtes Bitmuster geschrieben wird, welches den Variableninhalt darstellt. Der Typ der Variablen gibt Auskunft über das Format, d.h. darüber, wie dieses Bitmuster zu interpretieren ist, was es also "bedeutet"! Programmiersprachen, wie auf Deklarationen verzichten, machen zur Laufzeit eigene Annahmen über den Typ der verwendeten Variablen. Und die werden nicht immer genau mit den Absichten des Programmierers übereinstimmen, was zu schwierig zu erkennenden Fehlern führen kann. In den typ-strengen Sprachen hingegen muss der Programmierer genau spezifizieren, was er will - und Klarheit ist immer ein Vorteil.

Betrachten wir ein konkretes Beispiel: die Deklaration

in Delphi:

     var n : Integer;

in Java:

     int n;

erledigt zwei Aufgaben:

sie weist den Compiler an, in dem Programm dafür zu sorgen, dass zur Laufzeit für eine im Programmtext "n" genannte Variable Speicherplatz reserviert wird;
die Angabe des Typs der Variablen (in Delphi "Integer" und in Java "int") liefert die Information, in welchem Format die Variable im Speicher steht, also wieviele Bytes Speicherplatz sie benötigt und was die einzelnen Bits dabei bedeuten.

Liest ein Delphi- oder Java-Compiler die obige Deklaration, dann wird er 4 Byte Speicherplatz für die Variable n reservieren und dafür sorgen, dass die Bytes in umgekehrter Reihenfolge(!) ihrer Wertigkeit in den Speicher geschrieben werden. Nach der Zuweisung

in Delphi:

     n := 137682;

in Java:

     n = 137682;

stehen also (wegen 137682 = 219D2h) die Bytes

     D2h 19h 02h 00h

hintereinander an der für n reservierten Stelle des Speichers.

Da es eine ganze Menge elementarer Datentypen gibt, ist der Platzbedarf einer Variablen im Speicher alleine noch kein eindeutiger Hinweis auf den Typ der Variablen:

In Delphi benötigen die Datentypen "Byte" und "AnsiChar" beide jeweils 1 Byte. Es ist aber durchaus ein Unterschied, ob der Speicherinhalt "4Dh" die (Byte-)Zahl "77" oder den Buchstaben "M" bedeuten soll!

In Java benötigen die Datentypen "int" und "float" jeweils 4 Byte. Interpretiert man die hexadezimale Byte-Folge "41 7D D4 78h" als Integerzahl, dann kodiert sie die ziemlich große Zahl "1 098 765 432", also etwa 1,1 Milliarden; interpretiert man aber dieselbe Byte-Folge als "float"-Zahl, dann kodiert sie die Kommazahl "15,864372", also knapp 16!

1.2 Bisher bekannte Datentypen

In Delphi und Java sind schon eine ganze Menge von numerischen Standard-Datentypen "von Haus aus" verfügbar. Die wichtigsten davon sind glücklicherweise in nahezu allen wichtigen Programmiersprachen auf dieselbe Art und Weise implementiert. Lediglich die Bezeichnungen unterscheiden sich:

Variablen-Art	Typ-Name Delphi / Java	Werte-Bereich	Belegter Speicher
Ganze Zahlen	Byte / byte	0 .. 255	1 Byte
Ganze Zahlen	Integer / int	–2 147 483 648 .. 2 147 483 647	4 Byte
Fließkomma-Zahlen	Single / float	1.5 x 10^–45 .. 3.4 x 10^38, 7-8 Dez.-Stellen genau	4 Byte
Fließkomma-Zahlen	Double / double	5.0 x 10^–324 .. 1.7 x 10^308, 15-16 Dez.-Stellen genau	8 Byte

Schwieriger wird es bei der Kodierung von (Schrift-)Zeichen und Zeichenketten:

In Delphi gibt für die Kodierung von Buchstaben den 1 Byte großen Typ "AnsiChar". Da 1 Byte 256 verschiedene Werte annehmen kann, ist die Anzahl der damit kodierbaren Zeichen also auf 256 begrenzt. Eine Zeichenkette aus solchen AnsiChar-Buchstaben bildet dann einen "ShortString"; dieser kann maximal 255 Zeichen enthalten, was somit die maximale Länge einer Zeile ist.

Variablen- Art	Typ- Name	Werte- Bereich	Belegter Speicher
Zeichen	AnsiChar	{256 ASCII- Zeichen}	1 Byte
Zeichen- ketten	ShortString	{n Zeichen, n ≤ 255}	(n+1) Byte

In Java gibt für die Kodierung von Buchstaben den 2 Byte großen Typ "char". Da 2 Byte 65536 verschiedene Werte annehmen kann, ist die Anzahl der damit kodierbaren Zeichen also auf 65536 begrenzt. Eine Zeichenkette aus solchen AnsiChar-Buchstaben bildet dann einen "String"; dieser kann maximal 2 147 483 647 Zeichen enthalten, was somit die maximale Länge einer Zeile ist.

Variblen- Art	Typ- Name	Werte- Bereich	Belegter Speicher
Zeichen	char	{65536 UniCode- Zeichen}	2 Byte
Zeichen- ketten	String	{n Zeichen, n ≤ 2147483647}	≥ 2*n+4 Byte

Diese Tabellen sind bei weitem nicht vollständig; es sind nur die für uns bisher wichtigsten Datentypen aufgeführt. Die Angaben zum belegten Speicher können bei den verschiedenen Delphi-Versionen von den obigen Angaben abweichen, speziell bei den Zeichenketten, deren Implementierung in der Vergangenheit mehrfach überarbeitet wurde. Und natürlich gibt es auch in Delphi "Multibyte-Zeichen" und die dazugehörigen "langen Strings". Wer's genauer wissen will, kann Details dazu in der Online-Hilfe zu Delphi finden (Stichwort "Typen").

1.3 Der kleinste mögliche Datentyp: Boolean

In der obigen Tabelle fehlt noch ein elementarer Datentyp, der bisher noch nicht explizit aufgetaucht ist, den wir aber sehr wohl schon verwendet haben. Es handelt sich dabei um den Datentyp Boolean, der nur die beiden "Wahrheitswerte" true und false (also wahr und falsch) annehmen kann. Obwohl die damit transportierte Informationsmenge naturgemäß nur 1 Bit groß ist, belegt eine Variable von diesem Typ im Speicher ein ganzes Byte! Dies liegt daran, dass aus technischen Gründen auf den Speicher stets (mindestens) byte-weise zugegriffen wird.

Und wo sollen diese seltsamen Variablen in unseren bisherigen Programmen schon vorgekommen sein? Indirekt überall da, wo eine Bedingung programmiert wurde! Also zum Beispiel in der Entscheidungsbedingung jeder IF-ELSE-Konstruktion und in der Durchführungsbedingung jeder WHILE-Schleife! Allerdings haben wir an diesen Stellen bisher nie einzelne Variablen benutzt, sondern stets mit Hilfe von Termen formulierte Aussagen, die sich dann zur Laufzeit als wahr oder falsch erweisen konnten - in Abhängigkeit von den Werten der in den Termen verwendeten Variablen. Die Bedingungen waren also stets "boolsche Ausdrücke"; wenn sie aber zur Laufzeit "ausgerechnet" wurden, dann konnte es stets nur 2 mögliche Ergebnisse geben: wahr oder falsch!

Das Ergebnis der Berechnung eines boolschen Ausdrucks kann nun auch einer boolschen Variablen zugewiesen werden - genau wie das Ergebnis einer numerischen Berechnung in einer Double-Variablen gespeichert werden kann. Man wird boolsche Variablen vor allem in solchen Fällen verwenden, wo der berechnete "Wahrheitswert" an mehreren Stellen des Programms benötigt wird. Das prinzipielle Vorgehen zeigt das folgende

Beispiel:

In Delphi:

Links sehen Sie, wie wir dies bisher programmiert haben. Die Variante rechts verwendet eine zusätzliche boolsche Variable namens "not_ready", welche das Auftreten des Wahrheitswertes verdeutlicht:

 var i, s : Integer;

 begin
 s := 0;
 i := 1;

 While i <= 10 do begin
   s := s + i*i;
   i := i + 1;

   end;
 end;

 var i, s      : Integer;
     not_ready : Boolean;
 begin
 s := 0;
 i := 1;
 not_ready := True;
 While not_ready do begin
   s := s + i*i;
   i := i + 1;
   not_ready := i <= 10;
   end;
 end;

In Java:

Links sehen Sie, wie wir dies bisher programmiert haben. Die Variante rechts verwendet eine zusätzliche boolsche Variable namens "not_ready", welche das Auftreten des Wahrheitswertes verdeutlicht:


 int s = 0;
 int i = 1;

 while (i <= 10) {
   s = s + i*i;
   i = i + 1;

 };


 int s = 0;
 int i = 1;
 boolean not_ready = true;
 while not_ready {
   s = s + i*i;
   i = i + 1;
   not_ready := i <= 10;
 };

(Zugegeben, das Beispiel ist künstlich. Es dient lediglich dazu, den Umgang mit boolschen Variablen zu veranschaulichen. Kaum jemand würde die oben gestellte Aufgabe auf die angegebene Art und Weise lösen wollen. Zunächst ist hier eine REPEAT-Schleife sehr viel naheliegender als eine WHILE-Schleife, aber eigentlich ist die Aufgabe ein typischer Fall für eine FOR-Schleife! Und da wir dort keine Bedingung mehr zu verwalten haben, entfällt dann auch die Versuchung, zu einer boolschen Variablen zu greifen.)

Boolsche Variablen tauchen aber auch in den Komponenten auf, die wir in unsere Programme einbauen: das klassische Beispiel dafür ist die "Checkbox", die zur Laufzeit ein Häkchen tragen kann oder nicht. Dies wird in einer boolschen Variablen vermerkt und kann dort jederzeit vom Programm überprüft werden, z.B.:

In Delphi:

     If CheckBox1.Checked then
       ......
     else
       ......;

Anfänger neigen bei der Formulierung der Bedingung häufig dazu, statt der boolschen Variablen "CheckBox1.Checked" ganz ausführlich den boolschen Ausdruck "CheckBox1.Checked = True" zu schreiben. Dies liefert zwar stets ebenfalls das richtige Ergebnis und ist daher nicht falsch. Eleganter ist jedoch die Kurzform; machen Sie sich daher klar, dass diese tatsächlich schon das jeweilige Ergebnis enthält!

In Java:

     if (checkBox1.State) {
       .........
     } else {
       .........
     };

Anfänger neigen bei der Formulierung der Bedingung häufig dazu, statt der boolschen Variablen "CheckBox1.State" ganz ausführlich den boolschen Ausdruck "CheckBox1.State == true" zu schreiben. Dies liefert zwar ebenfalls stets den korrekten Wahrheitswert und ist daher nicht falsch. Eleganter ist jedoch die Kurzform; machen Sie sich daher klar, dass diese tatsächlich schon das jeweils korrekte Ergebnis enthält!

Man kann mit boolschen Werten auch rechnen: für die Verknüpfung boolscher Variablen stellen viele Programmiersprachen die logischen Operatoren NOT, AND und OR zur Verfügung. Für die Priorität dieser Operatoren gilt üblicherweise die Regel "NOT vor AND vor OR" (analog zu "Hoch vor Punkt vor Strich" bei den üblichen mathematischen Operatoren).

In Delphi werden NOT, AND und OR mit genau diesen Wörtern als Bezeichner bereitgehalten. Damit lassen sich auch kompliziertere zusammengesetzte Bedingungen formulieren, wie z.B.:

 If Checkbox1.Checked AND NOT Checkbox2.Checked then
   ........;

 oder:

 If Checkbox1.Checked OR ((s >= 3) AND (s <= 7)) then
   .........;

Die äußere Klammer um die beiden Teilbedingungen im letzten Beipiel ist eigentlich überflüssig, da AND ja ohnehin stärker bindet als OR. Häufig setzt man sie trotzdem, damit die Bedingung leichter lesbar wird. Beachten Sie aber, dass in Delphi die logischen Operatoren (also NOT, AND und OR) stärker binden als die Vergleichsoperatoren (<, > usw.). Die inneren Klammern um die Vergleiche sind also nötig!

In Java werden die logischen Operatoren NOT, AND und OR durch jeweils eigene Symbole ausgedrückt: NOT wird durch ein "!" dargestellt, AND durch das "&&" und ODER durch "||" (natürlich in Termen jeweils ohne die Anführungszeichen). Damit lassen sich auch kompliziertere zusammengesetzte Bedingungen formulieren, wie z.B.:

 if (Checkbox1.State && !Checkbox2.State) {
   ....... }

 oder:

 if ( Checkbox1.Checked || ((s >= 3) && (s <= 7)) ) {
   ....... }

Die mittlere und die inneren Klammern um die beiden Teilbedingungen im letzten Beipiel sind eigentlich überflüssig, da in Java > und < stärker binden als AND, und AND wiederum stärker bindet als OR. Häufig setzt man diese Klamern aber trotzdem, damit die Bedingung leichter lesbar wird.

1.4 Typumwandlungen

Gelegentlich muss in einem Programm der Inhalt einer Variablen in verschiedenen "Typ-Ansichten" interpretiert werden. Als Beispiel dafür betrachten wir eine einfache Methode zur Verschlüsselung von Texten, bei der der verschlüsselte Text aus dem Originaltext erzeugt wird, indem die Buchstaben des Alphabets einfach permutiert werden. Die einfachste Variante davon stellt die "Caesar-Verschlüsselung" dar:

Beispielsweise wird also für s=1 jeder Buchstabe durch seinen Nachfolger im Alphabet ersetzt. Damit das Verfahren am hinteren Ende des Alphabets nicht schief geht, denkt man sich das Alphabet zyklisch geschlossen: nach "Z" kommt wieder "A", dann "B" usw.

Wie wird nun diese Verschlüsselung in einem Programm realisiert? Aus naheliegenden Gründen wollen wir uns auf Texte beschränken, die nur aus Großbuchstaben bestehen. Selbst die Leerzeichen zwischen den einzelnen Worten wollen wir unberücksichtigt lassen, im Vertrauen darauf, dass sich diese nach der Entschlüsselung durch einen hinreichend cleveren Leser aus dem Kontext restaurieren lassen werden.

Nun ordnen wir jedem Buchstaben des Alphabets eine Nummer zu. Solch eine Zuordnung ist ja schon in der ASCII-Tabelle gegeben, wo jedes Zeichen durch seine ASCII-Nummer eindeutig identifiziert ist.

In Delphi können wir die ASCII-Nummer eines Zeichens durch eine Typ-Umwandlung erhalten: sind u und v CHAR-Variablen und a, n, m und b vom Typ INTEGER, dann wird mit

  a := Byte(u);
    { Typ-Umwandlung Zeichen -> Zahl }

die ASCII-Nummer des in u gespeicherten Zeichens in der Variablen a abgelegt. Wenn z.B. u das Zeichen "K" enthält, dann liefert Byte(u) den Wert 75, was die ASCII-Nummer von "K" ist. Wir wollen allerdings (aus später nachvollziehbaren Gründen) für unsere Numerierung bei "A" mit der "0" beginnen. "B" erhält dann die "1", "C" die "2" usw usf. Dies läßt sich erreichen, ohne dass wir die ASCII-Nummer von "A" nachschlagen:

  n := a - Byte('A')
    { Verschiebung ASCII-Nr von 'A' -> 0  }

liefert genau die gewünschte Zuordnung. Die verschlüsselnde Verschiebung um s Zeichen wird nun durch eine schlichte Addition erreicht. Damit wir dabei aber nicht über das Ende des Alphabets hinausrutschen, muss das Ergebnis noch MOD 26 genommen werden:

  m := (n + s) MOD 26
    { Verschiebung um s Zeichen  }

Um nun das zu u passende verschlüsselte Zeichen v zu erhalten, muss dieser Wert für g dann wieder in ein Zeichen umgewandelt werden:

  b := m + Byte('A');
    { Verschiebung  0 -> ASCII-Nr von 'A' }
  v := Char(b);
    { Typ-Umwandlung Zahl -> Zeichen }

In Java können wir die ASCII-Nummer eines Zeichens durch eine Typ-Umwandlung erhalten: sind u und v CHAR-Variablen und a, n, m und b vom Typ INTEGER, dann wird mit

  a = (int) u;
    // Typ-Umwandlung Zeichen -> Zahl

  n = a - (int) 'A';
    // Verschiebung  ASCII-Nr von 'A' -> 0

  m = (n + s) % 26;
    // Verschiebung um s Zeichen