Darstellungscodes

von Friedrich J.

Was ist ein Code (nach DIN 44300)?

Eine eindeutige Vorschrift für die Zuordnung (Codierung) der Zeichen eines Zeichenvorrats zu denjenigen eines anderen Zeichenvorrats. — Codierung = eindeutige, umkehrbare Abbildung von Zeichenfolgen auf Codewörter.

Welche fünf Arten der Codierung in der Technik gibt es und was bewirken sie?

1) Darstellungscodierung („Formatierung"), 2) Quellencodierung („Komprimierung", Redundanz/Irrelevanz entfernen), 3) Kanalcodierung („Fehlersicherung", Redundanz hinzufügen), 4) Leitungscodierung („Modulation"), 5) Kryptographie („Verschlüsselung"). — Knackpunkt: Quellencodierung ENTFERNT Redundanz, Kanalcodierung FÜGT sie hinzu.

Was ist der Unterschied zwischen Zifferncode und Zahlencode?

Zifferncode: genau 10 binäre Codewörter für die Dezimalziffern 0–9 (z.B. BCD, 1-aus-10). Zahlencode: bildet eine beliebig große Zahlenmenge ab (z.B. Dualcode, Oktalcode). — Beide sind numerische Codes.

Was ist die BCD-Codierung und ihre Codiervorschrift?

BCD (Binary Coded Decimal): jede einzelne Dezimalziffer wird durch ihre 4-stellige Binärkombination (Tetrade) dargestellt. — Beispiel (8-4-2-1): 6294 = 0110 0010 1001 0100. Knackpunkt: ziffernweise, nicht die ganze Zahl umrechnen!

Was ist eine Tetrade und was sind Pseudotetraden?

Tetrade = 4-Bit-Gruppe. Von den 2^4 = 16 möglichen Tetraden werden für die Ziffern 0–9 nur 10 benötigt; die übrigen 6 ungenutzten heißen Pseudotetraden. — Knackpunkt: 16 − 10 = 6 Pseudotetraden.

Was ist ein einschrittiger (stetiger) Tetradencode?

Ein Code, bei dem sich die Codewörter benachbarter Dezimalziffern um genau EINE Binärstelle unterscheiden. — Beispiel: Gray-Code. Gegenteil: mehrschrittige Codes (mehrere Bits ändern sich).

Was ist das zentrale Merkmal des Gray-Codes?

Aufeinanderfolgende Codewörter unterscheiden sich um genau ein Bit (einschrittig). — Anwendung: A/D-Wandler, digitale Übertragung; Vorteil: keine Hazards, Bitfehlerwahrscheinlichkeit ≈ Symbolfehlerwahrscheinlichkeit.

Was ist der 7-Bit-ASCII-Code?

American Standard Code for Information Interchange: Binärcode mit 7 Stellen → 2^7 = 128 Zeichen. — Davon 95 druckbare und 33 nicht-druckbare Steuerzeichen. Beispiele: a = 0x61, X = 0x58, ? = 0x3F.

Aufgabe: Wie lautet die ASCII-Codierung des Zeichens 'D'?

'D' = 0x44 = 1000100(2) = 68(10). — Merke: Großbuchstaben beginnen bei A = 0x41 = 65; 'D' ist der 4. → 65+3 = 68.

Was ist der erweiterte 8-Bit-ASCII / ISO/IEC 8859?

Erweiterung auf 8 Bit → 256 Zeichen, genormt als ISO/IEC 8859 mit 15 sprachspezifischen Zeichensätzen. — ISO 8859-1 = Latin-1 (westeuropäisch), z.B. ä = 0xE4. Heute meint „ASCII" meist 8 Bit.

Was ist Unicode?

Universelle, standardisierte Zeichencodierung für die Schriftzeichen aller bekannten Schriftkulturen; kompatibel mit ISO/IEC 10646 (UCS). — Aufbau: 32-Bit-Code, gegliedert in 17 Planes mit je 65.536 Zeichen.

Was ist ein Unicode-Codepunkt und wie wird er geschrieben?

Die Zeichencodierung in Unicode; geschrieben als U+ gefolgt von mindestens 4 Hex-Stellen (ggf. mit führenden Nullen). — Beispiel: U+00B5 = µ. Definierter Bereich: U+0000 … U+10FFFF.

Was ist die Basic Multilingual Plane (BMP)?

Plane 0 von Unicode, umfasst die Codepunkte U+0000 … U+FFFF (die gängigsten Zeichen). — Knackpunkt: Zeichen der BMP brauchen in UTF-8 maximal 3 Bytes.

Verfahren: Wie ist UTF-8 aufgebaut (Byte-Schema)?

1 Byte: 0xxxxxxx (U+0000–007F). 2 Byte: 110xxxxx 10xxxxxx (bis U+07FF). 3 Byte: 1110xxxx 10xxxxxx 10xxxxxx (bis U+FFFF). 4 Byte: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx (bis U+10FFFF). — Folgebytes beginnen immer mit 10.

Aufgabe: Wie lautet das UTF-8-Codewort für ä (U+00E4)?

U+00E4 = 0000 0000 1110 0100; liegt in U+0080–07FF → 2 Bytes. Schema 110xxxxx 10xxxxxx mit den letzten 11 Bits 00011100100: 11000011 10100100 = C3 A4. — Knackpunkt: Bits von rechts in die x-Positionen füllen.

Aufgabe: Wie lautet das UTF-8-Codewort für € (U+20AC)?

U+20AC = 0010 0000 1010 1100; liegt in U+0800–FFFF → 3 Bytes. 1110xxxx 10xxxxxx 10xxxxxx → 11100010 10000010 10101100 = E2 82 AC. — Merke: € braucht 3 Bytes.

Wie viele Bytes belegt das Zeichen 'a' in ISO 8859-15, UTF-8, UTF-16 und UTF-32?

ISO 8859-15: 1 Byte. UTF-8: 1 Byte (ASCII-Bereich). UTF-16: 2 Bytes (feste Code-Unit). UTF-32: 4 Bytes (feste Code-Unit). — UTF-8 ist für ASCII am sparsamsten.

Was ist UTF-32 und sein Vor-/Nachteil?

Feste Codewortlänge von 4 Bytes, 1:1-Abbildung der Codepunkte (keine echte Codierung). — Vorteil: unmittelbare Decodierung mit fester Zeit. Nachteil: hoher Speicherbedarf (bis Faktor 4) → ineffizient.

Wie viele Bytes belegt ein Zeichen, das in UTF-8 zu 4 Code-Units codiert?

4 Bytes – bei UTF-8 ist 1 Code-Unit = 1 Byte. — Analog: UTF-16-Code-Unit = 2 Bytes, UTF-32-Code-Unit = 4 Bytes.

Was ist Endianness (Big-Endian vs. Little-Endian)?

Reihenfolge der Bytes bei Mehr-Byte-Werten. Big-Endian (BE): höchstwertiges Byte zuerst. Little-Endian (LE): niederwertigstes Byte zuerst. — Beispiel 32-Bit 0x01020304: BE = 01 02 03 04, LE = 04 03 02 01.

Aufgabe: Eine 32-Bit-Zahl liegt in LE als 01 02 03 04 vor. Wie lautet der Big-Endian-Hexdump?

Byte-Reihenfolge umkehren: 04 03 02 01. — Knackpunkt: nur die Bytes spiegeln; bei mehreren Werten jeden Wert einzeln umdrehen.

Was ist eine BOM (Byte Order Mark) und welchen Codepunkt hat sie?

Ein vorangestelltes Zeichen U+FEFF, das die Byte-Reihenfolge kennzeichnet. — UTF-16: FE FF (BE) bzw. FF FE (LE). UTF-8: EF BB BF. Knackpunkt: bei UTF-8 spielt Endianness keine Rolle (BOM nur als Marker).

Warum spielt die Endianness bei UTF-8 keine Rolle?

Weil UTF-8 byteweise (Code-Unit = 1 Byte) definiert ist; die Bytereihenfolge innerhalb eines Zeichens ist durch das Schema (Startbyte + Folgebytes mit 10…) festgelegt. — Bei UTF-16/UTF-32 (Mehr-Byte-Units) ist Endianness dagegen relevant.

Was kennzeichnet den Morse-Code?

Binärer alphanumerischer Code aus Punkt/Strich (Dit/Dah) mit 36 Codewörtern (26 Buchstaben + 10 Ziffern). — Variable Codewortlänge (häufige Zeichen kurz); NICHT präfixfrei → eigenes Trennzeichen (Pause) nötig.

Was ist die Grundidee der Base64-Codierung?

Bitfolge in 6-Bit-Gruppen aufteilen; jede 6-Bit-Gruppe wird auf eines von 64 Zeichen (A–Z, a–z, 0–9, +, /) abgebildet. — 3 Bytes (24 Bit) → 4 Base64-Zeichen. Anwendung: binäre Daten als druckbarer Text (z.B. E-Mail).

Was ist eine Pseudotetrade konkret im 8-4-2-1-BCD-Code?

Eine der 6 Tetraden 1010, 1011, 1100, 1101, 1110, 1111 (Dezimalwerte 10–15), die keine gültige Dezimalziffer darstellen. — Bei BCD-Operationen müssen Pseudotetraden ggf. korrigiert werden.

Was ist der Unterschied zwischen einem numerischen und einem alphanumerischen Code?

Numerischer Code: stellt nur Ziffern/Zahlen dar (BCD, Dualcode). Alphanumerischer Code: stellt Buchstaben, Ziffern, Sonderzeichen dar (ASCII, Unicode, Morse, Base64). — Auswahlkriterium: Welche Zeichenmenge soll abgebildet werden?

Beitreten

Vorschau

Author

Friedrich J.

Informationen

Zuletzt geändert
vor einem Monat

Kurs melden