Wikipedia:Landsbybrønden/Redirect fra latinske til danske navne

Redirect fra latinske til danske navne redigér

Flyttet fra Opslagstavlen

Jeg opdagede lige at den meget brugte citizen science-app iNaturalist henviser sine danske brugere til dansk Wikipedia. Der er jo vældig fint, der er bare det problem at den er sat op til at bruge latinske navne (det er et internationalt projekt), så den ikke finder frem til artiklerne på da.wiki, hvis der ikke er en redirect fra det latinske navn. Problemet findes måske også i andre sammenhænge, så det er vigtigt når der oprettes artikler om alle arter i naturen, at lave en redirect fra det latinske navn til det danske. Det kan også hjælpe i afklaring af navne. Jeg har ingen fornemmelse af hvor mange der ikke har en sådan redirect, - har steenth evt. en liste i den righoldige samling? - Nico (diskussion) 9. aug 2020, 15:28 (CEST)

Ja, det er et problem at det (oftest) er glemt med REDIRECTs ved oprettelse af nye artikler om planter og dyr. Måske man kunne generere en liste af latinske og tilhørende danske navne og så lade en bot oprette redirets. Korrekt latinsk navn må i alle tilfælde kunne udtrækkes af taksoboksen (hvor niveauet art forekommer) og dansk er artikel-navnet. Listen skal så lige checkes, desværre nok manuelt, men det kan jeg gøre, for smuttere, f.eks. hvor slægtsnavnet ikke er skrevet fuldt ud osv. Formentlig kan det også drille med underarter, sorter etc.--Honymand (diskussion) 9. aug 2020, 16:03 (CEST)
Faktisk ville det være ønskeligt hvis en masse ting bare "kom af sig selv" ud fra takso-boksen, f.eks. også kategorier.--Honymand (diskussion) 9. aug 2020, 16:04 (CEST)
Der er muligheder. Men emnet er nok større end, hvad der er et opslag.. Landsbybrønden må være stedet at forsætte.... --Steen Th (diskussion) 9. aug 2020, 18:20 (CEST)
@Nico og Honymand: Jeg har kigget på wikidata for at fiske. Og her kan videnskabeligt navn (P225) bruges. Jeg har lavet følgende forespørgsel til det:
SELECT ?item ?itemLabel ?itemDescription ?vnavn WHERE {
  ?item wdt:P225 ?vnavn .
  ?wiki0 <http://schema.org/about> ?item .
  ?wiki0 <http://schema.org/isPartOf> <https://da.wikipedia.org/> .
  SERVICE wikibase:label { bd:serviceParam wikibase:language "da,en" } .
}

Prøv det!

Der er ca. 1900 af videnskabelige navne, som mangler. Der lidt forberedelse til det og nogle times kørsel for at lave omstillinger fra videnskabeligt navn til artikelnavn. --Steen Th (diskussion) 9. aug 2020, 20:42 (CEST)
Hvad nu hvis man vil begrænse søgningen til at itemDescription indeholder "species" eller "art".--Honymand (diskussion) 9. aug 2020, 21:54 (CEST)
Ja, jeg tror også det vigtigste er arterne. Familier ligger i flere tilfælde under det latinske navn, om det så er korrekt eller ej er en anden diskussion. - Nico (diskussion) 9. aug 2020, 23:29 (CEST)
Min brug af tid ens uanset om det kun er arter eller alle. Ellers er Wikidata en database, hvor beskrivelsen tit afspejler indholdet. Og hvad der er familie og art sker med egenskab taksonrang (P105). Den er mere præsis end hvad der tilfældigvis er i beskrivelsen. --Steen Th (diskussion) 10. aug 2020, 08:12 (CEST)

Denne query kunne evt. bruges

SELECT ?item ?itemLabel ?vnavn WHERE {
  ?item wdt:P225 ?vnavn .
  ?item wdt:P105 wd:Q7432 .
  ?wiki0 <http://schema.org/about> ?item .
  ?wiki0 <http://schema.org/isPartOf> <https://da.wikipedia.org/> .
  SERVICE wikibase:label { bd:serviceParam wikibase:language "da,en" } .
}

Prøv det!

Den finder bl.a disse som er fine:

  • Løve = Panthera leo
  • Vildhest = Equus ferus
  • Vandspir = Hippuris vulgaris
  • Ægte Ingefær = Zingiber officinale

Men den finder også disse

  • Human coronavirus HKU1 = Human coronavirus HKU1
  • Tick-borne encephalitis virus = Tick-borne encephalitis virus

Og flere lignende

Måske man bør begrænse sig til 3 riger (plante, dyr, svampe) eller 4 (medtage chromista/stramenophila). En anden mulighed er at frasortere artsnavne der ikke indeholder netop ét mellemrum.

Og kan man være sikker på at itemLabel altid afspejler titlen på artiklen på da-wiki? For mig ser det ud som om det er 2 forskellige dataelementer item label på dansk hhv. artikel titel på da-wiki. De angives hver for sig.

--Honymand (diskussion) 10. aug 2020, 08:52 (CEST)

Label og link er forskellige. Jeg har ikke linket med til dawiki min eksempel - det bruger jeg normalt ikke. Men jeg har fået dumpet henvisninger i wikidata til dawiki - jeg skulle finde et eksempel, hvor det blev brugt, samt tilpasse søgningen, så den kunne afvikles inden for tidsgrænsen. Så hvis nogen ikke flytter rundt på det fra nu til jeg er færdig, så er der ingen problemer med. Ellers kan jeg se at arter fylder ca. 2/3 af dem. Så resten er ikke noget problem at tage den med. Det er spørgsmålet et par timer mere eller mindre, som er mere end den oprindelige opgave kræver. Eller kan jeg ikke direkte søge på riger. Det kræver vel at gå via søge hierarkisk igennem taxonomisystemet. --Steen Th (diskussion) 10. aug 2020, 09:21 (CEST)
OK! Jeg foretager mig ikke yderligere (med mindre nogen beder mig om det).--Honymand (diskussion) 10. aug 2020, 09:29 (CEST)
De første 10 er dannet: Kinorhyncha, Alcidae, Turnix sylvaticus, Hirudo medicinalis, Scomber scombrus, Megaptera novaeangliae, Jabiru mycteria, Trilobita, Gallinula chloropus og Tympanuchus pallidicinctus. Resten kommer senere. --Steen Th (diskussion) 10. aug 2020, 10:43 (CEST)
Arh, der fanger man lige et andet problem. Det videnskabelige navn er ikke altid angivet på samme måde på tværs af wiki'er. Dette skyldes typisk en af 2 ting
  • Tastefejl som der formentlig er tale om ved Turnix sylvaticus - i taksoboksen står der Turnix sylvatica
  • Forskellig videnskabelig tradition eller opfattelse. Jeg ved at på en-wiki og wikispecies er man HELT fremme i skoene og ændrer straks videnskabelige navne når ny viden foreligger, mens man på da-wiki er noget mere konservativ.
--Honymand (diskussion) 10. aug 2020, 11:03 (CEST)
Jeg har kørslen af resten igang. Jeg læser at navne, som i Wikidata, ikke giver problemer. Det ligner, at der er en opgave med at tjekke om Wikidata og den danske Wikipedia er i sync og den kunne være at {{Taksoboks}} kunne tilføje en sammenligning imellem hvad der er i infoboksen og Wikidata. Noget som vi har brugt nogle få andre steder. --Steen Th (diskussion) 10. aug 2020, 16:47 (CEST)
Herligt, - jeg har lavet en stribe nedslag, men kun fundet en enkelt hvor der var et synonymproblem, men redireckten førte det rigtige sted hen. Jeg bukker og takker.. - Nico (diskussion) 10. aug 2020, 17:20 (CEST)