[Olug-list] Emacs, ssh, og ÆØÅ
Nicolai Langfeldt
nicolai at linpro.no
Tue, 14 Mar 2006 12:49:56 +0100
John L Fjellstad wrote:
> On Sun, Mar 12, 2006 at 10:47:56PM +0100, Roy-Magne Mo wrote:
>
>>Er det egentlig eit problem? Vil tru at du skal encode alle teikn som
>>ikkje er 7 bit uansett?
>
>
> utf-8 og ISO8859-1 er forskjellig. Fra det jeg forstår, er ISO8859-1
> 7-bit, noe some nødvendigvis ikke er sant for utf-8.
Det fant du på ikke sant? Du må slutte å finne på ting og så poste dem.
iso8859 serien er 8 bits tegnsett - "ascii++" med regionale utvidelser
for europa.
UTF-8 er en 8-bits kode-metode for unicode tegnsett. Noen andre her
postet navnet på en unicode artikkel som nok bør leses. Unicode tegn
representeres internt i maskiner som integerer fra 0 til 0x10FFFF - 21
bit - men det omtales vel som et 32 bits tegnsett.
(http://www.unicode.org/versions/Unicode4.0.0/ch02.pdf, pdf fil side 15,
overskrift "2.4 Code Points and Characters".
Nicolai