Tegnsæt: Forskelle mellem versioner

Content deleted Content added
Jeg har tilføjet en smule tekst, som er understøttet af den kilde jeg har tilføjet.
Tags: Mobilredigering Mobilwebredigering
opdateret
Linje 1:
Et '''tegnsæt''' betegner den teknik, der bruges i digital teknologi, for at varetage skrifttegn fra forskellige sammenhænge - mest typisk sprogsammenhænge.
Et '''tegnsæt''' er kodning af [[tegn (skrift)|tegn]]. Resultatet kan f.eks. vises i en [[tabel]] med tegnet eller [[symbol]]et i den første kolonne og kode- eller talværdien i den næste.
 
== Introduktion ==
Man tilknytter med andre ord et tal – til et tegn eller symbol, så det gøres muligt at lagre informationen [[digital]]t f.eks. på en [[pc]].
I den digitale teknik er menneskets skrifttegn data. Præsentationen, ved print eller i et skærmbillede, forudsætter en digital font. I fonten er hvert tegn nummereret, så det er ligetil…men det viser sig at der reelt er forbavsende mange tegn at tage hensyn til. Her har ''tegnsættet'' været den gængse teknik taget i brug for at skelne mellem det der ''på engelsk'' kaldes ''character set'' - d.v.s. et relativt stort antal forskellige tegn, eksempelvis 256, grupperet sammen. I parentes bemærket er den engelske term for tegnsæt-metoden {{lang-en|character encoding}}. En digital font er konstrueret til at varetage et specifikt ''character set'', eller eventult flere specifikke ''character sets''. De tekniske retningslinjer for at bruge en digital font omfatter derfor en formalisme - ''character encoding'' eller ''tegnsæt'' - der entydigt viser hvilke tegn-numre den pågældende font omfatter, og iøvrigt også entydigt viser hvilke skrifttegn brugeren kan forvente under det pågælden nummer {{harv|Adobe|1985|p=91}}.
 
== Formater ==
[[Bogstav]]erne er måske de mest benyttede tegn., Detde kaldes for de '''alfabetiske tegn'''. Hertil kommer [[tal]]lene, som kaldes de '''numeriske tegn'''. Kombinationen af bogstaver og tal kaldes også for '''alfanumeriske tegn'''.
 
Endelig følger "resten" eller alt andet, herunder '''specialtegn'''. Sammen med de to forrige grupper kaldes de for '''alfameriske tegn'''.
 
Tegnsæt har været kendt længe før den moderne [[informationsteknologi]]:
* De [[oprindelige amerikanere]] udvekslede oplysninger via røgsignaler.
* [[Morse-kode]]n anvendtes bl.a. til at sende radiotelegrammer og er et tegnsæt repræsenteret ved korte og lange tryk på en [[telegrafnøgle]].
* [[Telex]]-kommunikation handler om forbundne elektriske [[skrivemaskine]]r, hvor et tastetryk på afsenderen medførte en udskrift af det samme symbol på modtageren papir.
Det blev til de første digitale tegnsæt, der bestod af mindst 6 [[bit]], hvilket giver 64 tegnmuligheder – til bogstaver, tal og andre tegn. Senere øgede man til 7 bit eller 128 varianter, så både store og små bogstaver blev muligt. Endelig skulle der også være plads til specielle bogstaver og symboler for enkelte lande, da elektronisk post blev hverdag, og så øgede man til 8 bit eller 256 tegn.
 
Det er ikke nok, hvis alle verdens sprog skal integreres i et og samme internationale tegnsæt, (d.v.s. derved''character encoding''). I [[Unicode]] dagensfindes tegn-data lysformater med op til hele 32 bit, mens det vidt udbredte ''Unicode transformation format-8'' ([[UTF-8]]) har et varierende antal bits (8,16,24,32) {{harv|Unicode|2014}}. Unicode er en fortøbende og meget lang talrække der på denne måde inkluderer under et bl.a. kinesiske[[kinesisk]], japanske[[japansk]], [[koptisklatin]]ske og [[kyrillisk]]e alfabeter, [[koptisk]], [[gotisk (skrift)|gotiskegotisk]], [[kileskrift]], [[ogam]] og [[runealfabet]] symboler også fandt en plads,samt endda tegn for nogle ikke-eksisterende sprogkunstsprog såsom fantasisproget Klingon fandt også sin plads.<ref>[[:en:List of ISO 15924 codes by letter code]]</ref>
 
Eksempler på tegnsæt:
* 6-bit [[Fieldata]] fra [[Univac]]
* 7-bit og 8-bit ''American Standard Code for Information Interchange'', ([[ASCII]])
* 7-bit [[ASCII]] i flere varianter, herunder US-ASCII
* 8-bit [[EBCDIC]] [[IBM]]'s oprindelige tegnsæt
* 31-bit [[Unicode]] i flere indkodningerformater, herunder [[UTF-8]] indender forer almindelig i et [[GNU/Linux]] system (bitantal:8,16,24,32), og [[UTF-16]] inden(bitantal:16,32) forder også er kendt af [[Microsoft Windows|Windows]].
 
== Kilder/referencerSe også ==
{{reflist}}
{{Commonscat|Codes}}
Mere om [[pc]]'ens håndtering af [[digital]] data.
 
== Eksterne links ==
* [http://unicode.org/faq/ Unicode FAQ]
* [[:en:List of ISO 15924 codes by letter code]]
 
== Kilder ==
* {{Citation
|title = Postscript language tutorial and cookbook
|chapter = 9.2 CHARACTER ENCODING
|url = http://www-cdf.fnal.gov/offline/PostScript/BLUEBOOK.PDF
|date = 1985
|author = Adobe Systems Incorporated
|publisher = Addison-Wesley
|Ref = CITEREFAdobe1985
}}
* {{Citation
|work = Unicode FAQ
|chapter = UTF-8, UTF-16, UTF-32 & BOM
|chapterurl = http://unicode.org/faq/utf_bom.html
|date = 2014
|publisher = Unicode inc.
|Ref = Unicode 2014
}}
 
 
 
{{Datalogistub}}
 
[[Kategori:Tegnsæt| ]]
[[Kategori:Informationsteknologi]]