Bij de meeste organisaties zal het DMS bomvol staan met allerlei bestandsformaten. Waarschijnlijk zal een groot deel bestaan uit PDF's en Office-formaten, maar wie weet welke exoten je verder nog tegen komt!

Ik geloof niet dat het praktisch is om slechts een beperkte set aan bestandsformaten (open standaarden) toe te staan in het DMS. Hoewel dit wel minder kopzorgen zou zijn voor de archiefbeheerder, geeft het de backoffice-ambtenaar alleen maar een reden om nog meer om het systeem heen te werken. Bovendien laten burgers, bedrijven en ketenpartners zich nog minder makkelijk bedwingen.

Ik ben eerder op zoek naar een methode om:

  • te inventariseren welke bestandsformaten allemaal voorkomen in het DMS,
  • per bestandsformaat de risico's m.b.t. duurzame archivering in kaart te brengen,
  • een (jaar-)plan op te stellen om de grootste risico's aan te pakken.

Dit zou volgens mij geen eenmalige actie moeten zijn, maar een  PDCA-cyclus.

Concreter dan dit heb ik het nog niet verzonnen. Zijn er al organisaties die dit doen en hieronder informatie (bijv. procesbeschrijvingen) willen delen?

 

Weergaven: 599

Hierop reageren

Berichten in deze discussie

Wat het eerste punt betreft: je kunt, althans in Windows, de extensies achter de bestandsnamen zichtbaar maken.

In de Verkenner van Windows 10 gaat dat via menu Bestand -> Map- en Zoekopties wijzigen -> Weergave -> Extensies voor bekende bestandstypen verbergen. Als daarvoor een vinkje staat moet dat weg.

Maar waarschijnlijk is je DMS niet vanuit de Windows Verkenner benaderbaar. Toch weet ik dat ik bij ons aan de technisch beheerders van het DMS (storage- of systeembeheerders) een overzicht van bestandsformaten kan opvragen op elke server, map of dataopslag. TreeSize heet dat hele simpele programmaatje waarmee ze het doen. Dan heb je punt 1 alvast getackeld.

Binnen ons DMS (Corsa) kunnen we zoekvragen maken met betrekking tot het bestandsformaat. Zo kunnen we een overzicht maken van de formaten die opgeslagen zijn. Zo'n lijst hebben we vorig jaar een keer gemaakt en dat gaf wel een mooi beeld. Verreweg het meeste materiaal was van een gangbaar formaat, zoals pdf's, tiff's en office-documenten. Het bleek ook dat het enkele van onze digitaal-o-zo-vaardige collega's was gelukt om niet-bestaande formaten op te slaan (iemand ooit gehoord van de extensie '.tuinka'? ;-)). Die hebben we in ieder geval direct hersteld.

Als je zo'n lijst eenmaal hebt is inderdaad de vraag: wat ga je ermee doen?

Wil je proactief niet-duurzame formaten 'verduurzamen', bijvoorbeeld door periodiek al die formaten te converteren? Of doe je het meer event-gestuurd en onderneem je alleen actie als een niet-duurzaam formaat in onbruik raakt of op het moment dat het naar een e-depot overgedragen wordt?

En als je gaat converteren, doe je dit dan standaard voor àlle niet-duurzame bestanden of neem je ook zaken als de bewaartermijn mee en converteer je alleen wat langer bewaard moet worden dan x jaar? En welk risico loop je als je wel actie gaat ondernemen? Is 'niets doen' in sommige gevallen een veiligere optie? 

De antwoorden zijn bij ons ook nog niet uitgekristalliseerd, maar genoeg voer voor discussie!   

 

Hallo Marco,

Goed dat er al tijdens hun verblijf in het DMS wordt nagedacht over informatieobjecten en hun formaat(risico's). Ik lees dat je niet gelooft in het beperken van de set toegestane formaten. Als Nationaal Archief geven we iets soortgelijks aan in onze preservation policy: "Indien vlak voor overbrenging informatie moet worden omgezet naar een open standaard/formaat is het raadzaam om hierover vooraf advies te vragen aan het NA aangezien er bij deze omzetting ongewenst informatieverlies kan optreden." En: "belangrijker [dan het bestandsformaat] zijn de keuzen met betrekking tot wat je wilt bewaren qua gedrag, inhoud, vorm en structuur van het informatie object, met andere woorden de essentiële kenmerken." Vanwege de risico's op informatieverlies bij formaatconversies leggen we momenteel "geen beperking op met betrekking tot het aantal of type bestandsformaten dat opgenomen wordt."  (http://www.nationaalarchief.nl/sites/default/files/docs/preservatio...).

 

Verder: er zijn tools voor het identificeren van bestanden, aangenomen dat ze 'onder de motorkap' van het DMS kunnen worden ingezet. Zie bijvoorbeekd deze video: https://www.udemy.com/file-format-identification-tools/. De prototypische 'content profiling tool' C3PO gaat nog een stapje verder, zie http://openpreservation.org/blog/2012/11/19/c3po-content-profiling-....

 

Een methode om de risico's van bestandsformaten in te schatten staat beschreven in http://scape-project.eu/wp-content/uploads/2013/11/iPres2013_Graf_R... en wordt van commentaar voorzien in http://openpreservation.org/blog/2013/09/30/assessing-file-format-r....

 

Kortom, er zijn meerdere mogelijkheden, maar bezint eer ge begint :-) en beperk het denken niet tot de formaten, de vorm. Sta ook stil bij de duurzame toegankelijkheid van gedrag, inhoud, structuur, context (metadata) en bijvoorbeeld doelgroep van de informatie.

 

Antwoorden op discussie

RSS

© 2024   Gemaakt door Marco Klerks.   Verzorgd door

Banners  |  Een probleem rapporteren?  |  Algemene voorwaarden