Tegnsett
Fra Wikipedia, den frie encyklopedi
Tegnsett er det som definerer hvordan gitte bokstaver og andre lesbare symboler skal oversettes til verdier, slik at de kan behandles av datamaskiner. Et gitt tegn kan bli representert av ulike verdier avhengig av hvilket tegnsett som brukes. Verdiene kan være tall, oktetter, elektriske pulser, morsekode eller andre typer som egner seg for elektronisk databehandling.
Begrepet tegnsett blir ofte brukt både om hvordan tegn skal assosieres med verdier, og om hvordan disse verdiene skal kodes som oktetter (bytes) i en datamaskin.
Det moderne Unicode er en omfattende standard som inkluderer all verdens bokstaver, tall og andre symboler, og definerer hvordan hver av dem skal assosieres med en spesifikke tallverdier. Det finnes flere standarder for å oversette disse tallverdiene til oktetter. Noen eksempler er UTF-7, UTF-8, UTF-16, UCS-2 og UCS-4.
[rediger] Se også
- ASCII
- ISO-8859-1
- UTF-8
- UTF-16
- Tegnspråk
- Morsealfabetet