Numrene 32 til 126 er standardiserte og inneholder alle amerikanske tall, bokstaver og symboler. ASCII 0 til 31 og 127 er kontrolltegn som sjelden representerer bokstaver eller symboler. Dette kaller vi 7-bit ASCII (27 = 128).
Mange 8-bit varianter
For å få plass til spesialtegn og internasjonale bokstaver, som ÆØÅ, er det blitt laget mange varianter av 8-bits ASCII. I MS-DOS har vi CodePage-systemet. CodePage 437 er et amerikansk tegnsett med rammer og internasjonale tegn. Dessverre for oss i Norge, mangler tegnsettet stor og liten Ø. Derfor erstatter vi Cent- og Yen-tegnene med henholdsvis stor og liten Ø. Dette er gjort i CodePage- variantene 850 og 865. I Windows bruker vi ANSI-tegnsettet som endelig ser ut til å bli en slags standard i den vestlige verden. ANSI-tegnsettet inneholder alle norske tegn.
UNICODE inneholder alt
I andre deler av verden benyttes det langt større alfabeter med tusenvis av tegn. For å håndtere alle verdens alfabeter har vi nå fått UNICODE. UNICODE representerer hver bokstav med 16-bit eller to byte. UNICODE inneholder alle vestlige tegn i tillegg til kinesisk, japansk, arabisk, indisk, hebraisk, gresk osv. Med hele 65.536 tegn til rådighet, har UNICODE rikelig med plass til alle sammen. Ulempen er at en UNICODE-basert tekstfil, med norsk eller engelsk tekst, tar dobbelt så stor plass i minnet eller på harddisken i forhold til en tilsvarende ASCII-basert tekstfil.
Les artikkelen gratis
Logg inn for å lese eldre artikler. Det koster ingenting, gir deg tilgang til arkivet vårt og sikrer deg en bedre brukeropplevelse.
Gå til innlogging medVi bruker aID som innloggings-tjeneste, med din aID-konto kan du enkelt logge inn på alle våre sider som krever dette.
Vi bryr oss om ditt personvern
Dinside er en del av Aller Media, som er ansvarlig for dine data. Vi bruker informasjonskapsler (cookies) og dine data til å forbedre og tilpasse tjenestene, tilbudene og annonsene våre.
Vil du vite mer om hvordan du kan endre dine innstillinger, gå til personverninnstillinger