SIARD-DK er et format til langtidsbevaring af digitalt skabte data eventuelt tilhørende dokumenter.

Formatet er udviklet af Rigsarkivet. Det bruges i Danmark, Grønland og Færøerne til at bevare bevaringsværdige data fra offentlige myndigheders it-systemer i såkaldte arkiveringsversioner[1].

Formatet er stærkt inspireret af det schweiziske format SIARD 1.0 (Software Independent Archival of Relational Databases[2]), men adskiller sig herfra ved blandt andet at understøtte bevaring af digitale dokumenter samt at stille ekstra krav til dokumentation og tabel- og kolonnebeskrivelser.

Filosofi redigér

SIARD-formatet bruges til bevare data fra relationelle databaser[1].

I analysen af det danske it-landskab blev det klart for Rigsarkivet, at det også er nødvendigt at bevare digitale dokumenter, da de udgør en stor del af it-systemernes informationsmængde.

SIARD-DK tager fortsat udgangspunkt i arkivering af komplette databaser, men gør det også muligt at bevare digitale dokumenter (i konverteret form).

Filosofien bag formatet er, at hvis data skal bevares i lang tid (årtier eller endda århundreder), må de bevares uafhængigt af software (database og operativsystem). Derfor indebær formatet også, at data trækkes ud af den kørende database og gemmes i XML-filer, hvis opbygning og indhold er nøje beskrevet.

For at sikre en forståelse af databasens sammenhænge bliver databasens relationer og nøgler også beskrevet og gemt.

Derved gemmes data og sammenhængene i systemet, mens applikationslaget og de funktionaliteter der ligger her (såsom brugergrænsefladen) ikke arkiveres. Til gengæld er det almindeligt at arkivere screendumps af brugergrænsefladen i kontekstdokumentationen.

Opbygning redigér

Når et it-system arkiveres, laves en kopi af systemets data og metadata, som kaldes for en arkiveringsversion (i modsætning til "driftsversion", som er det kørende it-system)[1].

En arkiveringsversion består groft sagt af fire lag informationer:

  1. Beskrivelse af arkivaliets kontekst
  2. Beskrivelse af den arkiverede databases opbygning
  3. Konkrete data fra databasen
  4. Digitale dokumenter

Anvendelse redigér

Alle bevaringsværdige digitale data fra danske kommuner, regioner og statslige myndigheder skal bevares i SIARD-DK-format.[3]

Juridisk grundlag redigér

SIARD-DK er beskrevet i Rigsarkivets bekendtgørelse 1007[4], og en dertil hørende vejledning[5].

Software redigér

Der findes i øjeblikket to offentligt tilgængelige værktøjer, som kan benyttes i arbejdet med SIARD-DK:

  • ADA. Et værktøj udviklet af Rigsarkivet som benyttes til test og validering af arkiveringsversioner[6].
  • Database Preservation Toolkit[7][8]. Et værktøj udviklet af portugisiske Keep, som kan benyttes til at konvertere relationelle databaser til forskellige bevaringsformater, herunder SIARD og SIARD-DK.

Referencer redigér

  1. ^ a b c "Arkiveret kopi" (PDF). Arkiveret fra originalen (PDF) 23. november 2018. Hentet 23. november 2018.
  2. ^ "Arkiveret kopi". Arkiveret fra originalen 24. november 2018. Hentet 23. november 2018.
  3. ^ Aflevering af arkiveringsversioner - Kommunale myndigheder
  4. ^ Bekendtgørelse om arkiveringsversioner - retsinformation.dk
  5. ^ "Arkiveret kopi" (PDF). Arkiveret fra originalen (PDF) 24. november 2018. Hentet 23. november 2018.
  6. ^ ADA - testprogram til arkiveringsversioner
  7. ^ DBPTK - Database Preservation Toolkit
  8. ^ GitHub - keeps/db-preservation-toolkit: Database Preservation Toolkit