Tegnsæt: Forskelle mellem versioner
Content deleted Content added
Jeg har tilføjet en smule tekst, som er understøttet af den kilde jeg har tilføjet. Tags: Mobilredigering Mobilwebredigering |
opdateret |
||
Linje 1:
Et '''tegnsæt''' betegner den teknik, der bruges i digital teknologi, for at varetage skrifttegn fra forskellige sammenhænge - mest typisk sprogsammenhænge.
== Introduktion ==
I den digitale teknik er menneskets skrifttegn data. Præsentationen, ved print eller i et skærmbillede, forudsætter en digital font. I fonten er hvert tegn nummereret, så det er ligetil…men det viser sig at der reelt er forbavsende mange tegn at tage hensyn til. Her har ''tegnsættet'' været den gængse teknik taget i brug for at skelne mellem det der ''på engelsk'' kaldes ''character set'' - d.v.s. et relativt stort antal forskellige tegn, eksempelvis 256, grupperet sammen. I parentes bemærket er den engelske term for tegnsæt-metoden {{lang-en|character encoding}}. En digital font er konstrueret til at varetage et specifikt ''character set'', eller eventult flere specifikke ''character sets''. De tekniske retningslinjer for at bruge en digital font omfatter derfor en formalisme - ''character encoding'' eller ''tegnsæt'' - der entydigt viser hvilke tegn-numre den pågældende font omfatter, og iøvrigt også entydigt viser hvilke skrifttegn brugeren kan forvente under det pågælden nummer {{harv|Adobe|1985|p=91}}.
== Formater ==
[[Bogstav]]erne er måske de mest benyttede tegn
Det blev til de første digitale tegnsæt, der bestod af mindst 6 [[bit]], hvilket giver 64 tegnmuligheder – til bogstaver, tal og andre tegn. Senere øgede man til 7 bit eller 128 varianter, så både store og små bogstaver blev muligt. Endelig skulle der også være plads til specielle bogstaver og symboler for enkelte lande, da elektronisk post blev hverdag, og så øgede man til 8 bit eller 256 tegn.
Det er ikke nok, hvis alle verdens sprog skal integreres i et og samme internationale tegnsæt
Eksempler på tegnsæt:
* 6-bit [[Fieldata]] fra [[Univac]]
* 7-bit og 8-bit ''American Standard Code for Information Interchange'', ([[ASCII]])
* 8-bit [[EBCDIC]] [[IBM]]'s oprindelige tegnsæt
*
==
{{Commonscat|Codes}}
Mere om [[pc]]'ens håndtering af [[digital]] data.
== Eksterne links ==
* [http://unicode.org/faq/ Unicode FAQ]
* [[:en:List of ISO 15924 codes by letter code]]
== Kilder ==
* {{Citation
|title = Postscript language tutorial and cookbook
|chapter = 9.2 CHARACTER ENCODING
|url = http://www-cdf.fnal.gov/offline/PostScript/BLUEBOOK.PDF
|date = 1985
|author = Adobe Systems Incorporated
|publisher = Addison-Wesley
|Ref = CITEREFAdobe1985
}}
* {{Citation
|work = Unicode FAQ
|chapter = UTF-8, UTF-16, UTF-32 & BOM
|chapterurl = http://unicode.org/faq/utf_bom.html
|date = 2014
|publisher = Unicode inc.
|Ref = Unicode 2014
}}
{{Datalogistub}}
[[Kategori:Tegnsæt| ]]
[[Kategori:Informationsteknologi]]
|