Wikipedia:Landsbybrønden/Tekniske spørgsmål om navnerums- og interwikipræfikser mv.

Tekniske spørgsmål om navnerums- og interwikipræfikser mv. redigér

Jeg laver regelmæssigt forskellige analyser ud fra Wikipedia-databasedumps. Men jeg har visse problemer med korrekt fortolkning af henvisninger, og det vil blive værre når jeg udvider til analyse af andre sprogudgaver end den danske. Jeg har i den forbindelse forskellige spørgsmål som eksperterne ud i MediaWiki og Wikimedia måske kan hjælpe mig med:

  1. Hvor skaffer man en tabel over de brugte navnerumspræfikser for en Wikipedia på en givent sprog?
  2. Så vidt jeg ved, fungerer de engelske navnerumspræfikser også her i den danske Wikipedia. Er det korrekt forstået, og gælder det generelt for samtlige Wikipediaer?
  3. Hvor skaffer man en tabel over samtlige aktive interwikipræfikser for Wikipediaer (dem som behandles særskilt ved at blive listet i rubrikken "Andre sprog")? Hvis der også er oplysninger om sprognavnet og det brugte tegnsæt, er det et yderligere plus.
  4. Hvor skaffer man en tabel over samtlige øvrige aktive interwikipræfikser?
  5. Er der nogle standardiserede formater til at lave lister over ting som måske med fordel kunne rettes af en bot?
  6. Hvor kommer man bedst i kontakt med bot-udviklere?
  7. Hvor kommer man bedst i kontakt med udviklere af værktøjer til offline-analyse?
  8. Hvor burde disse spørgsmål være stillet henne?

Byrial 9. jun 2005 kl. 20:30 (CEST)

Du kan finde præfikser i sprogfilerne der følger med Mediawiki softwaren. http://wikipedia.sourceforge.net De engelske præfikser virker på alle wikier, medmindre der er nogen der har dummet sig med sprogfilerne. Sådanne tilfælde er en fejl og skal rettes. Navnene på de interwikilinks der regnes som sprog kan du finde i language/Names.php samme sted. Fra og med version 1.5 af Mediawiki softwaren er kodningen for alle wikipediaer UTF-8. De øvrige interwikiprefixer finder du også i softwaredistributionen, i maintenance/wikipedia-interwiki.sql og maintenance/interwiki.sql
Kontakt med bot-udviklere og folk der kører andre analyser kan jeg ikke give dig et eksakt bud på. Postlisten wikitech-l er nok et godt udgangspunkt. Og hvis da ikke havde haft en udvikler, ville det sikkert også have været bedre at stille de øvrige spørgsmål der.
Tak. Jeg har kastet et hurtigt blik på de Mediawiki-filer du nævner. De er ikke komplette med interwikipræfikser som Wikipedia bruger. For eksempel mangler tlh: (klingon) som er en Wikipedia der kan laves interwiki til, men som ikke behandles som et sprog. Desuden indeholder maintenance/wikipedia-interwiki.sql andet end sprog (for eksempel meta:). Wikipedia må bruge andre tabeller end dem som findes i den officielle mediawiki-distribution. Ved du hvordan man får adgang til dem? Byrial 9. jun 2005 kl. 22:51 (CEST)
Det der ikke er med i releases er tilføjet lokalt, og eksisterer i så fald formentlig temmeligt sporadisk på de enkelte wikier. Hvad angår tlh, kan jeg se at dej er med i wikipedia-interwiki.sql i udviklingsversionen, så det er muligvis den du skal kaste dig over. Hvis du har brug for en komplet liste af de aktuelle tabeller, skal du have fat på en udvikler med databaseadgang. Der kan jeg desværre ikke hjælpe. Et spørgsmål på wikitech-l er nok den bedste vej frem der. -- Anders Wegge Jakobsen (diskussion) 9. jun 2005 kl. 22:59 (CEST)
Du kommer nemmest i kontakt med bot udviklere ved at tilmelde dig mailinglisten under http://sourceforge.net/projects/pywikipediabot/ og det er også et godt sted at stille de spørgsmål du har. --Christian List 10. jun 2005 kl. 23:28 (CEST)