Denne projektside holdes ikke længere opdateret, og bibeholdes først og fremmest af historiske årsager.
Yderligere information findes på diskussionssiden eller i historikken.

Ofte stillede spørgsmål om webbrowsere og UTF-8

Denne side indeholder uddybninger af de hyppigst forekommende problemer, som optræder i forbindelse med webbrowsere og UTF-8.

Generelt redigér

Windows generelt redigér

Hvorfor vises der firkanter eller spørgsmålstegn i stedet for særlige tegn? redigér

Problem: Nogle kan ikke vises korrekt (eksempelvis kinesisk og arabisk). I stedet viser Internet Explorer og Opera nogle små firkanter, for eksempel tegn ala □□ i stedet for 北京. Mozilla viser spørgsmålstegn. Der mangler skrifttyper til visning af de pågældende sprog.

Løsning: Under installeringen af Windows installeres som standard ikke alle tilgængelige skrifttyper (fonte), for at spare plads. De fleste nødvendige skrifttyper kan dog efterfølgende installeres. Dog mangler der Windows-skrifttyper til visse sprog, blandt andre malayalam. Det kan være en hjælp at installere skrifttypen Arial Unicode MS, som er tilgængelig iMicrosoft Office 2000, Microsoft FrontPage 2000, samt i nyere versioner. Ejer man ikke et af disse produkter, kan man også hente skrifttyper (der for nogles vedkommende koster penge) fra andre kilder; se ml:Wikipedia:Welcome, newcomers (på engelsk).

Her er en vejledning i hvordan man i forskellige versioner af Windows efterinstallerer skifttyper:

  • Under Windows 2000: I kontrolpanelet finder man ikonen "Landeindstillinger". I feltet "Generelt" er der en liste over "Sprogindstillinger for systemet". Her skal der sættes kryds ved alle sprogfamilier, hvis skrifttegn man ønsker at kunne vise.
  • Under Windows XP: I kontrolpanelet finder man ikonen "Regions- og sprogindstillinger". I feltet "Sprog" skal der være kryds ved "Installer filer til østasiatiske sprog" og/eller ved "Installer filer til sprog med komplekse skrifttegn og tegn der skrives fra højre mod venstre".

Hvad skal jeg være opmærksom på, hvis jeg ikke installerer de fornødne tegnsæt? redigér

"Da visningsproblemet kun gælder eksotiske særtegn, som jeg alligevel sjældent forstår, har jeg indtil nu ikke ulejliget mig med at installere flere tegnsæt. Hvilke komplikationer kan jeg forvente?"

  • Ved læsning af Wikipedia er der ikke noget særligt man behøver at være opmærksom på. For tegn der ikke er installeret, vises i stedet blot de ovenfor nævnte tegn (□, ¤ eller ?).
  • Ved redigering af artikler må disse tegn ikke ændres, da de tilhørende særtegn så stadig kan blive vist i andre brugeres browsere. Selvom din egen browser ikke kan vise disse tegn, så ved den alligevel hvilket tegn der er tale om. Det vil sige også når der eksempelvis vises □ eller ? i stedet for katagana-tegnet WI (ヰ), så behandler browseren det alligevel som katagana-tegnet WI og brugere der har installeret japanske tegnsæt, får også præsenteret tegnet efter du har redigeret artiklen. Alternativt kan du i det mindste installere et Fallback Font, der tydeliggør ukendte tegn for dig, så det bliver sværere ved en fejl at komme til at beskadige dem.
Herefter skal kendte styresystems- og browserkombinationer behandles, som ved gemning af tekst uden at de nødvendige tegn er installeret, forårsager problemer. Det vil sige forklaringen, der pt. befinder sig under #Internet Explorer, #Lynx og #Linux generelt, ville kunne indpasses her.

Hvorfor viser min tekstbrowser tegnsalat i stedet for særtegn? redigér

Problem: I stedet for særtegn vises ulæselige tegnkæder, for eksempel ð£ð¥Ðüð║ð▓ð░ i stedet for Москва eller ├ñ i stedet for ä. Det drejer sig om Unicode-tegn, der af browseren eller i teksttilstand under DOS ikke opfattes som sådanne, men derimod som Windows Codepage 850 eller Codepage 437. Særtegnene bliver godt nok ikke ødelagt ved gemning, men det er svært at læse og redigere teksten.

Løsning: Ingen. Ved redigering kan særtegn i nødstilfælde skrives som HTML-entiteter, for eksempel &aelig for et æ, &Oslash for et Ø og &aring for et å . Du må under ingen omstændigheder ændre den eksisterende "tegnsalat"!

GNU/Linux generelt redigér

Skal jeg installere eller opsætte et eller andet? redigér

Programmer der anvender GTK+2.0 eller højere bruger internt UTF-8 og har dermed en meget god understøttelse af UTF-8, og man er som regel ikke nødt til at foretage særlige indstillinger; det samme gælder KDE2- og KDE3-programmer. Ønsker du at bruge UTF-8 i et terminalvindue (f.eks. med Lynx), skal en passende Locale installeres. Se også de browserspecifikke spørgsmål.

Ønsker du at vide mere om GNU/Linux og UTF-8, kan Step by step introduction to switching your debian installation to utf-8 encoding måske være interessant, dog er dokumentet skrevet på engelsk.

Hvorfor vises mange tegn ikke? redigér

Når der bliver vist ? eller ? i stedet for det forventede, skyldes det formentlig at browseren ikke kunne finde en passende skrifttype til tegnet. Der er talrige frit tilgængelige fontpakker, der passer sammen med mange alfabeter. Det er dog kun nødvendigt at installere fontene (skrifttyperne), hvis de pågældende alfabeter har interesse; uden de pågældende skrifttyper, kan man alligevel redigere Wikipedia.

Hvorfor viser min tekstbrowser tegnsalat i stedet for særtegn? redigér

Problem: Når terminalvinduet som tekstbrowseren (f.eks. Lynx eller w3m) kører i, anvender en anden tegnkodning, vises ulæselige tegnkæder i stedet for særtegn, eksempelvis Ð?оÑ?ква i stedet for Москва eller ä i stedet for ä. Det drejer sig om UTF-8-kodede tegn, der ikke opfattes sådan af konsollen, men derimod som Latin-1. Selvom særtegnene ikke bliver ødelagt, er det svært at læse og redigere teksten.

Løsning:

  • I GNU/Linux-konsollen: Konsollen indeholder skriptet unicode_start, der får konsollen til at skifte til UTF-8-tilstand. Dermed kan man bruge Lynx til at redigere Wikipedia, muligvis bliver nogle tegn ikke vist, men så kan man installere de tilsvarende konsolskrifttyper. (Måske er det også muligt at anvende dynafont.) [1]
  • I terminalvindue: Mange terminalprogrammer (f.eks. gnome-terminal) kan sættes i UTF-8-tilstand med kommandoen echo -e '\e%G', anvender man en UTF-8-Locale, er det i princippet ikke nødvendigt. Xterm startes med skriptet uxterm. [2]

Internet Explorer redigér

Hvorfor ødelægger Internet Explorer under Mac OS særtegn ved gem? redigér

Problem: Ved gemning af en artikel erstattes nogle særtegn, blandt andre japanske og græske, af spørgsmålstegn og ødelægger dermed siden.

Løsning: Ingen. Internet Explorer til Mac OS videreudvikles ikke af Microsoft. man kan ikke redigere Wikipedia med Internet Explorer under Mac OS, prøv ikke engang på det. I stedet skal man anvende en fungerende browser, for eksempel Safari, der følger med nyere versioner af Mac OS X og som gratis kan hentes til ældre versioner (dog ikke til Mac OS 9.x eller tidligere), fra Apple hjemmeside eller Mozilla Firefox, der er frit tilgængelig til Mac OS X. (En version til Mac OS 9 findes også.)

Min Internet Explorer viser alle særtegn forkert redigér

Problem: Hvis du har installeret downloadmanageren Reget, bliver integrationen med den automatiske genkendelse af tegnsættet ødelægt. Derfor vises UTF-8-sider som Latin1-sider og resultatet er tegnsalat.

Løsning: Den eneste måde denne fejl kan afhjælpes på, er at slå Regets integration fra. Producenten af Reget er bekendt med fejlen og problemet lader til at være i Internet Explorer og ikke i Reget - derfor kan man ikke forvente at der bliver udsendt en rettelse.

Hvorfor bliver særtegn transkriberet (ændret til latinske bogstaver)? redigér

Problem: Særtegn bliver automatisk ændret til latiske bogstaver. På den måde bliver eksempelvis den kyrilliske tekst Архангельск automatisk Arhangel'sk. Ved gem bliver ændringen ikke ført tilbage, hvorfor den kyrilliske tekst går tabt og siden dermed ødelægges. Løsning: I Options (tilgængelig via tasten O) finder man indstillingsmuligheden Display character set. Her skal der stå UNICODE (UTF-8). Derefter bevares særtegn når man gemmer. Dette skal man gøre for at kunne redigere Wikipedia med Lynx. Ved ændring af indstillingen skal man sikre sig at indstillingen "Save options permanently" (helt øverst på Options-siden) er aktiveret, så indstillingen bevares til næste gang programmet køres.

Desuden skal konsollen kunne vise Unicode-tegn. Se GNU/Linux generelt: Hvorfor viser min tekstbrowser tegnsalat i stedet for særtegn?.

Netscape redigér

Kan jeg redigere Wikipedia ved hjælp af Netscape Navigator 4.x? redigér

Netscape Navigator version 4.x må under ingen omstændigheder anvendes til at redigere Wikipedia-sider, da den ødelægger særtegn. Men til læsning er Navigator 4.x i praksis uanvendelig, da den ikke i tilstrækkelig grad understøtter mange af de teknikker, som Wikipedia anvender, blandt andre CSS.

Du opfordres kraftigt til at skifte til en moderne browser, for eksempel Netscape 7, som man gratis kan hente, eller Mozilla Firefox, som er frit tilgængelig.

Hvorfor vises med Netscape 7 danske tegn korrekt i "Wikipedia:"-navnerumme, men ikke i artikelnavnerummet? redigér

Her drejer det sig formentlig om et cache-problem (ikke browserspecifikt): Nogle artikler mellemlagrers af serveren, for hurtigere at kunne "udlevere" dem. Disse versioner er endnu ikke kodet i UTF-8. Problemet kan afhjælpes ved at fjerne den gamle version fra cachen med følgende link: http://da.wikipedia.org/w/wiki.phtml?title=Titel&action=purge (Titel udskiftet med navnet på den problematiske artikel).

Privoxy redigér

Hvorfor ødelægger Privoxy de danske bogstaver og andre særtegn ved gem? redigér

I reklameblokeringsprogrammet Privoxy er der i version 3.0.2 en programfejl i den såkaldte Demoronizer, hvor de danske bogstaver og andre ikke-ASCII-tegn ødelægges når man redigerer en artikel [3]. I version 3.0.3 blev fejlen rettet. Du må under ingen omstændigheder redigere Wikipedia-artikler før Demoronizer'en er blevet slået fra eller Privoxy er blevet opgraderet!

Hvorfor vises særtegn forkert? redigér

Problem: Nogle accenter vises forkert, f.eks. Espan~ol i stedet for Español. Andre særtegn (f.eks. kinesisk) udskiftes med spørgsmålstegn. Ved gem bliver disse særtegn helt slettet og siden ødelægges dermed.

Løsning: I Options (tilgængelig via tasten "o") skal man i kategorien Charset Settings sætte indstillingsmuligheden Display Charset til Unicode (UTF-8). Dette skal man gøre for at kunne redigere Wikipedia med Lynx.

Desuden skal konsollen kunne vise Unicode-tegn. Se GNU/Linux generelt: Hvorfor viser min tekstbrowser tegnsalat i stedet for særtegn?.