Codice Baudot
Da Wikipedia, l'enciclopedia libera.
Il codice Baudot, così chiamato in onore del suo ideatore Emile Baudot, è un sistema di codifica per un set di caratteri utilizzato nelle telescriventi prima dei sistemi EBCDIC e ASCII.
Il codice originario fu sviluppato nel 1874 con il nome di International Telegraph Alfabet n. 1 (ITA1) e non è più in uso. Veniva codificato utilizzando una tastiera a cinque tasti dove ogni tasto corrispondeva ad un bit di un sistema di codifica a cinque livelli. Un sistema meccanico scandiva la tastiera, dopodiché liberava i tasti per permettere l'inserimento del carattere successivo.
Intorno al 1901 il codice originario fu rivisto da Donald Murray, il quale riorganizzò i caratteri, ne aggiunse di nuovi e introdusse i codici shift, che consentivano di cambiare il set di caratteri in uso. Con l'introduzione di questa codifica si cominciarono ad usare tastiere più simili alle attuali. La codifica dei caratteri fu riorganizzata in modo che i caratteri più utilizzati corrispondessero ad un minore numero di commutazioni e quindi minore usura dei meccanismi.
Una ulteriore modifica dovuta essenzialmente alla Western union fu la rimozione di alcuni caratteri. Questa ultima versione è nota come codice Baudot oppure International Telegraph Alphabet No 2 (ITA2). Il codice ITA2 è ancora usato in alcune applicazioni e in particolare tra i radioamatori (RTTY).
Codice hex |
Codice binario |
Serie dei caratteri (LTRS) | Serie dei simboli (FIGS) |
---|---|---|---|
00 | 00000 | NULL: nessun carattere, nastro senza perforazione | |
01 | 00001 | E | 3 |
02 | 00010 | LF (Line feed): avanzamento di una linea | |
03 | 00011 | A | - |
04 | 00100 | SP - Spazio | |
05 | 00101 | S | ' |
06 | 00110 | I | 8 |
07 | 00111 | U | 7 |
08 | 01000 | CR (Carriage Return): ritorno del carrello a inizio riga | |
09 | 01001 | D | ENQiry: richiesta di identificazione |
0A | 01010 | R | 4 |
0B | 01011 | J | BELL: suona un campanello per avvisare l'operatore |
0C | 01100 | N | , |
0D | 01101 | F | ! |
0E | 01110 | C | : |
0F | 01111 | K | ( |
10 | 10000 | T | 5 |
11 | 10001 | Z | + |
12 | 10010 | L | ) |
13 | 10011 | W | 2 |
14 | 10100 | H | £ |
15 | 10101 | Y | 6 |
16 | 10110 | P | 0 |
17 | 10111 | Q | 1 |
18 | 11000 | O | 9 |
19 | 11001 | B | ? |
1A | 11011 | G | & |
1B | 11011 | FIGS: passa alla modalità simboli | |
1C | 11100 | M | . |
1D | 11101 | X | / |
1E | 11110 | V | ; |
1F | 11111 | LTRS: passa alla modalità lettere |
NOTA: i codici utilizzati nella tabella si intendono con il bit meno significativo a destra. l'ordine di trasmissione dei bit può però differire tra i diversi produttori.
Nel codice ITA2 i caratteri sono rappresentati da cinque bit, e sono impiegate due serie di simboli, le lettere (LTRS) ed i simboli (FIGS). Il segnale FIGS (11011) indica che i caratteri successivi devono essere interpretati come simboli, fino alla ricezione del segnale LTRS (11111). Il codice ENQuiry richiede all'altro terminale di identificarsi (equivale a chiedere "chi sei?")
Nel sistema telex i simboli corrispondenti ai codici 0D, 14 e 1A non sono utilizzati.
Si noti che la codifica binaria dei codici di controllo sono definiti in modo da essere simmetrici, in modo che inserendo un nastro perforato al contrario non causi problemi agli apparati, ed il testo trasmesso possa comunque essere interpretato. I codici FIGS (11011), LTRS (11111) e spazio (00100) sono simmetrici, mentre CR (01000) e LF (00010), poiché sono normalmente inviati in coppia, producono lo stesso risultato (testina a capo sulla nuova linea). Il codice LTRS (11111) è usato anche per cancellare caratteri dal nastro riperforandolo, come l'equivalente DEL nel codice ASCII.
La sequenza RYRYRY... è usata nei messaggi di prova poiché rappresentando la sequenza 01010 10101 ... impegna al massimo i meccanismi delle telescriventi. Alcune implementazioni del codice ITA2 negli Stati Uniti, differiscono nell'uso dei codici ENQ, + e dei simboli associati ai caratteri f, g, h rispetto al codice standard rappresentato nella tabella.