Was ist ein Code (nach DIN 44300)?
Eine eindeutige Vorschrift für die Zuordnung (Codierung) der Zeichen eines Zeichenvorrats zu denjenigen eines anderen Zeichenvorrats. — Codierung = eindeutige, umkehrbare Abbildung von Zeichenfolgen auf Codewörter.
Welche fünf Arten der Codierung in der Technik gibt es und was bewirken sie?
1) Darstellungscodierung („Formatierung"), 2) Quellencodierung („Komprimierung", Redundanz/Irrelevanz entfernen), 3) Kanalcodierung („Fehlersicherung", Redundanz hinzufügen), 4) Leitungscodierung („Modulation"), 5) Kryptographie („Verschlüsselung"). — Knackpunkt: Quellencodierung ENTFERNT Redundanz, Kanalcodierung FÜGT sie hinzu.
Was ist der Unterschied zwischen Zifferncode und Zahlencode?
Zifferncode: genau 10 binäre Codewörter für die Dezimalziffern 0–9 (z.B. BCD, 1-aus-10). Zahlencode: bildet eine beliebig große Zahlenmenge ab (z.B. Dualcode, Oktalcode). — Beide sind numerische Codes.
Was ist die BCD-Codierung und ihre Codiervorschrift?
BCD (Binary Coded Decimal): jede einzelne Dezimalziffer wird durch ihre 4-stellige Binärkombination (Tetrade) dargestellt. — Beispiel (8-4-2-1): 6294 = 0110 0010 1001 0100. Knackpunkt: ziffernweise, nicht die ganze Zahl umrechnen!
Was ist eine Tetrade und was sind Pseudotetraden?
Tetrade = 4-Bit-Gruppe. Von den 2^4 = 16 möglichen Tetraden werden für die Ziffern 0–9 nur 10 benötigt; die übrigen 6 ungenutzten heißen Pseudotetraden. — Knackpunkt: 16 − 10 = 6 Pseudotetraden.
Was ist ein einschrittiger (stetiger) Tetradencode?
Ein Code, bei dem sich die Codewörter benachbarter Dezimalziffern um genau EINE Binärstelle unterscheiden. — Beispiel: Gray-Code. Gegenteil: mehrschrittige Codes (mehrere Bits ändern sich).
Was ist das zentrale Merkmal des Gray-Codes?
Aufeinanderfolgende Codewörter unterscheiden sich um genau ein Bit (einschrittig). — Anwendung: A/D-Wandler, digitale Übertragung; Vorteil: keine Hazards, Bitfehlerwahrscheinlichkeit ≈ Symbolfehlerwahrscheinlichkeit.
Was ist der 7-Bit-ASCII-Code?
American Standard Code for Information Interchange: Binärcode mit 7 Stellen → 2^7 = 128 Zeichen. — Davon 95 druckbare und 33 nicht-druckbare Steuerzeichen. Beispiele: a = 0x61, X = 0x58, ? = 0x3F.
Aufgabe: Wie lautet die ASCII-Codierung des Zeichens 'D'?
'D' = 0x44 = 1000100(2) = 68(10). — Merke: Großbuchstaben beginnen bei A = 0x41 = 65; 'D' ist der 4. → 65+3 = 68.
Was ist der erweiterte 8-Bit-ASCII / ISO/IEC 8859?
Erweiterung auf 8 Bit → 256 Zeichen, genormt als ISO/IEC 8859 mit 15 sprachspezifischen Zeichensätzen. — ISO 8859-1 = Latin-1 (westeuropäisch), z.B. ä = 0xE4. Heute meint „ASCII" meist 8 Bit.
Was ist Unicode?
Universelle, standardisierte Zeichencodierung für die Schriftzeichen aller bekannten Schriftkulturen; kompatibel mit ISO/IEC 10646 (UCS). — Aufbau: 32-Bit-Code, gegliedert in 17 Planes mit je 65.536 Zeichen.
Was ist ein Unicode-Codepunkt und wie wird er geschrieben?
Die Zeichencodierung in Unicode; geschrieben als U+ gefolgt von mindestens 4 Hex-Stellen (ggf. mit führenden Nullen). — Beispiel: U+00B5 = µ. Definierter Bereich: U+0000 … U+10FFFF.
Was ist die Basic Multilingual Plane (BMP)?
Plane 0 von Unicode, umfasst die Codepunkte U+0000 … U+FFFF (die gängigsten Zeichen). — Knackpunkt: Zeichen der BMP brauchen in UTF-8 maximal 3 Bytes.
Verfahren: Wie ist UTF-8 aufgebaut (Byte-Schema)?
1 Byte: 0xxxxxxx (U+0000–007F). 2 Byte: 110xxxxx 10xxxxxx (bis U+07FF). 3 Byte: 1110xxxx 10xxxxxx 10xxxxxx (bis U+FFFF). 4 Byte: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx (bis U+10FFFF). — Folgebytes beginnen immer mit 10.
Aufgabe: Wie lautet das UTF-8-Codewort für ä (U+00E4)?
U+00E4 = 0000 0000 1110 0100; liegt in U+0080–07FF → 2 Bytes. Schema 110xxxxx 10xxxxxx mit den letzten 11 Bits 00011100100: 11000011 10100100 = C3 A4. — Knackpunkt: Bits von rechts in die x-Positionen füllen.
Aufgabe: Wie lautet das UTF-8-Codewort für € (U+20AC)?
U+20AC = 0010 0000 1010 1100; liegt in U+0800–FFFF → 3 Bytes. 1110xxxx 10xxxxxx 10xxxxxx → 11100010 10000010 10101100 = E2 82 AC. — Merke: € braucht 3 Bytes.
Wie viele Bytes belegt das Zeichen 'a' in ISO 8859-15, UTF-8, UTF-16 und UTF-32?
ISO 8859-15: 1 Byte. UTF-8: 1 Byte (ASCII-Bereich). UTF-16: 2 Bytes (feste Code-Unit). UTF-32: 4 Bytes (feste Code-Unit). — UTF-8 ist für ASCII am sparsamsten.
Was ist UTF-32 und sein Vor-/Nachteil?
Feste Codewortlänge von 4 Bytes, 1:1-Abbildung der Codepunkte (keine echte Codierung). — Vorteil: unmittelbare Decodierung mit fester Zeit. Nachteil: hoher Speicherbedarf (bis Faktor 4) → ineffizient.
Wie viele Bytes belegt ein Zeichen, das in UTF-8 zu 4 Code-Units codiert?
4 Bytes – bei UTF-8 ist 1 Code-Unit = 1 Byte. — Analog: UTF-16-Code-Unit = 2 Bytes, UTF-32-Code-Unit = 4 Bytes.
Was ist Endianness (Big-Endian vs. Little-Endian)?
Reihenfolge der Bytes bei Mehr-Byte-Werten. Big-Endian (BE): höchstwertiges Byte zuerst. Little-Endian (LE): niederwertigstes Byte zuerst. — Beispiel 32-Bit 0x01020304: BE = 01 02 03 04, LE = 04 03 02 01.
Aufgabe: Eine 32-Bit-Zahl liegt in LE als 01 02 03 04 vor. Wie lautet der Big-Endian-Hexdump?
Byte-Reihenfolge umkehren: 04 03 02 01. — Knackpunkt: nur die Bytes spiegeln; bei mehreren Werten jeden Wert einzeln umdrehen.
Was ist eine BOM (Byte Order Mark) und welchen Codepunkt hat sie?
Ein vorangestelltes Zeichen U+FEFF, das die Byte-Reihenfolge kennzeichnet. — UTF-16: FE FF (BE) bzw. FF FE (LE). UTF-8: EF BB BF. Knackpunkt: bei UTF-8 spielt Endianness keine Rolle (BOM nur als Marker).
Warum spielt die Endianness bei UTF-8 keine Rolle?
Weil UTF-8 byteweise (Code-Unit = 1 Byte) definiert ist; die Bytereihenfolge innerhalb eines Zeichens ist durch das Schema (Startbyte + Folgebytes mit 10…) festgelegt. — Bei UTF-16/UTF-32 (Mehr-Byte-Units) ist Endianness dagegen relevant.
Was kennzeichnet den Morse-Code?
Binärer alphanumerischer Code aus Punkt/Strich (Dit/Dah) mit 36 Codewörtern (26 Buchstaben + 10 Ziffern). — Variable Codewortlänge (häufige Zeichen kurz); NICHT präfixfrei → eigenes Trennzeichen (Pause) nötig.
Was ist die Grundidee der Base64-Codierung?
Bitfolge in 6-Bit-Gruppen aufteilen; jede 6-Bit-Gruppe wird auf eines von 64 Zeichen (A–Z, a–z, 0–9, +, /) abgebildet. — 3 Bytes (24 Bit) → 4 Base64-Zeichen. Anwendung: binäre Daten als druckbarer Text (z.B. E-Mail).
Was ist eine Pseudotetrade konkret im 8-4-2-1-BCD-Code?
Eine der 6 Tetraden 1010, 1011, 1100, 1101, 1110, 1111 (Dezimalwerte 10–15), die keine gültige Dezimalziffer darstellen. — Bei BCD-Operationen müssen Pseudotetraden ggf. korrigiert werden.
Was ist der Unterschied zwischen einem numerischen und einem alphanumerischen Code?
Numerischer Code: stellt nur Ziffern/Zahlen dar (BCD, Dualcode). Alphanumerischer Code: stellt Buchstaben, Ziffern, Sonderzeichen dar (ASCII, Unicode, Morse, Base64). — Auswahlkriterium: Welche Zeichenmenge soll abgebildet werden?
Zuletzt geändertvor 9 Tagen