Wij werken met Decos 5.1. Voor onze substitutie willen wij dat eigenlijk alle bestandsformaten (pdf, tiff, word, excel etc..) uiteindelijk worden geconverteerd naar een PDF/A bestand als de workflowactiviteit 'archiveren' wordt afgehandeld en alle documenten naar de archieffase gaan (Record Keeping System).

Hierdoor kan met één handeling aan het einde van werkproces de bestanden in een open standaard worden opgeslagen.

 

Echter, Decos biedt tot nu toe alleen de mogelijk om de office-bestanden om te zetten naar een pdf/a-bestand, maar niet de niet-officebestanden zoals pdf-formaten.

 

Heeft iemand een idee of weet iemand een leverancier die hier een rol in kan spelen?

Decos denkt momenteel niet echt mee..

Weergaven: 3954

Hierop reageren

Berichten in deze discussie

Er valt op pdf/a misschien best wat af te dingen, maar is op dit moment het beste alternatief. Bij toekomstige conversie/migratie is standaardisatie van een bestandsformaat een randvoorwaarde.

Waarom vind je pdf/a het beste alternatief? Wat maakt pdf/a beter dan andere beschikbare formaten die ook aan de Archiefregeling voldoen?


Jack, je leest niet wat niet wat ik schrijf, er zijn meerdere mogelijkheden, echter vrijwel alle gemeenten kiezen op dit moment voor standaardisatie en voor pdf/a.

ja, ik weet waar de meesten voor kiezen (ik ook).
Maar je schrijft dat pdf/a op dit moment het beste alternatief is. Waarom?

Even tijd voor een aantal feitelijkheden:

PDF/A-1a

PDF/A-1a is bedoeld voor het omzetten van documenten die in een "office" applicatie vervaardigd worden waarbij de metadata door de office-applicatie mee opgeslagen kan worden (zoals aanmaakdatum, auteur, wijzigingsdatum enzovoort).

PDF/A-1b

PDF/A-1b is bedoeld voor het omzetten van gescande documenten c.q. foto's waarvan de primaire metadata die aan een "office" document hangen per definitie niet vanuit het digitale document aanwezig kan zijn (bijvoorbeeld auteur) en waar standaard dus een beperktere set aan metadata aan vast zit.

PDF/A en duurzaamheid

De allereerste PDF/a bestanden zijn en blijven raadpleegbaar met behulp van alle (ook toekomstige) PDF-readers. Met andere woorden de PDF/A is ontworpen om nooit "opgewaardeerd" te hoeven worden om duurzaamheid te garanderen.

Het PDF/A formaat is ontwikkeld en getest en door onder andere de ISO organisatie en in Nederland door het forum standaardisatie van de Nederlandse overheid vrijgegeven als archief-formaat ter vervanging van papier en heeft als zodanig ook een plek gekregen op hun lijst van "pas toe of leg uit".

PDF/A is het enige formaat dat het uiterlijk van het document inclusief bijvoorbeeld lay-out en fontkeuze fontkeuze volledig respecteert. Dat geldt bijvoorbeeld weer niet voor XML of Open Office bestanden waar je afhankelijk bent van stylesheets of toevallig op het leesstation aanwezige fonts voor een correcte weergave van de bestanden. Dit moeten we niet onderschatten. Als je iemand een PDF stuurt dan weet je op voorhand precies wat de lezer gaat zien na het ter plekke openen. Dat moet je met actieve bestandsformaten  zoals XML en ODF maar afwachten, daar ben je volledig afhankelijk van de gebruikersinstellingen en aanwezige fonts op het raadpleegstation.

PDF/A en spreadsheets/CADfiles

Steevast wordt altijd gemopperd over het gegeven dat CAD files en spreadsheets niet lekker opgeslagen worden als PDF/A en/of dat de functionaliteit (gedrag) dan niet meer is zoals het originele bestand was. Ik wil hier toch nog eens benadrukken dat het archiveren betekent dat we feiten willen vastleggen op het moment dat op basis van die feiten besluiten zijn genomen die we ergens in de toekomst willen kunnen verdedigen met het archiefstuk als bewijsstuk. Immers als het wel is toegestaan om een spreadsheet in papieren vorm te archiveren en te gebruiken als bewijsstuk, waarom zouden we dan bij de digitale representatie daarvan ineens ook de formules moeten kunnen overleggen. Daarnaast staat de ontwikkeling in PDF/A niet stil, in oktober 2012 is PDF/A versie 3 door de ISO vrijgegeven, deze variant is letterlijk ontwikkeld om spreadsheets en CAD tekeningen "embedded" op te slaan in toch een archiefformaat, dit is dus het ultieme antwoord voor diegenen die uiterlijk en gedrag in één file willen vastleggen.

Bestaande PDF bestanden converteren naar PDF/A

Dan de vraag wat moet je doen met PDF bestanden die nog geen PDF/A zijn. Hier ontstaat in de praktijk de meeste ellende. De PDF/A richtlijnen zijn logischerwijs nogal stringent in wat wel en wat niet mag. we moeten namelijk de toegankelijkheid blijven waarborgen. Dit betekent dat de meeste automatische converters bij het omzetten van standaard PDF naar PDF/A fouten zullen tegenkomen die de conversie verhinderen en error meldingen opleveren waar de meeste mensen geen idee van hebben hoe ze dat nou kunnen oplossen. Mijn advies in dergelijke situaties is laat deze PDF's zoals ze zijn of converteer ze naar PDF versie 1.4 (ook PDF versie 1.4 is door de ISO opgenomen als open formaat). de Nederlandse overheid heeft in de wettelijke bepalingen en voorschriften niet voor niets de lijst met toepasbare documentformaten de naam meegegeven pas toe of leg uit. Als er goede redenen zijn om niet te kiezen voor een van de bestandsformaten die op de lijst "pas toe of leg uit" staan, dan heb je met een niet converteerbare PDF dus een goede "leg uit" situatie!

Ik hoop met deze bijdrage iets van de hiervoor beschreven onzekerheden te hebben weggenomen. maar sta natuurlijk volledig open om inhoudelijk dieper op de materie in te gaan als er toch vragen of onduidelijkheden omtrent dit onderwerp zijn blijven bestaan.

Leon, dankjewel, het zou een goed idee zijn dat opleidingen op het gebied van informatiebeheer je in zouden huren om deze kennis over te brengen aan het veld.

Ik zou het graag doen Yvonne

en toch is het grappig.

@Leon, je geeft aan dat alle PDF-bestanden ALTIJD gelezen kunnen worden met een pdf-reader. Wie garandeert dat?

Enkele aandachtspunten:


Het kan best zijn dat PDF/A meer respect heeft voor behoud van het uiterlijk van een document.
In het stuk over PDF en spreadsheets geef je aan dat gedrag van een document lang niet altijd relevant is om te bewaren. Dat klopt. En hetzelfde geldt voor de layout, het uiterlijk van een document.
Het gaat om de bewaring van de relevante informatie.

Ontwikkelingen op gebied van PDF en PDF/A staan inderdaad niet stil, zie ook de informatie hierover op DEN.nl

“PDF/A-3

In 2012 is versie 3 van PDF/A uitgebracht. Meest opvallende en omstreden uitbreiding van het formaat is de mogelijkheid om andersoortige bestanden in te sluiten in de PDF schil. Zo kan bijvoorbeeld een rekenblad, een tekstverwerkingsbestand of een CSV bestand worden ingesloten. Er wordt hierbij wel gesproken van "hybride archivering" of een gebundeld formaat. Een belangrijk nadeel hiervan is dat zo'n PDF/A niet langer 'self-contained' is. Er zijn immers andere applicaties nodig om de ingesloten bestanden te kunnen uitlezen. De status van PDF/A-3 voor lange termijn archivering is daarmee omstreden. Er zijn wellicht use cases denkbaar waarin gebundelde documenten nuttig kunnen zijn - voorbeelden daarvan zijn te vinden in de omschrijving van PDF/A-3 door de Library of Congres. In het 2014 verschenen NSDA (National Digital Stewardship Alliance) rapport The Benefits and Risks of the PDF/A-3 file Format For Archival Institutions wordt - met zoveel woorden - het gebruik PDF/A-3 voor archivering ontraden. Mocht er grote behoefte bestaan aan de fysieke bundeling van bestanden dan liggen formaten als BagIt File Packaging Format en (een beperkte vorm van) ZIP meer voor de hand. 

Conversie van PDF naar PDF/A

In theorie zijn er goede redenen te bedenken waarom conversie van PDF naar PDF/A nuttig kan zijn. Zo kunnen externe afhankelijkheden een PDF kwestbaar maken voor incompatibele of minder authentieke weergave - bij een missend font bijvoorbeeld - van de content. De huidige - 2014 - praktijk is echter anders. De conversie van PDF naar PDF/A is foutgevoelig en er zijn - ernstig genoeg - geen goede validators voorhandig om de mogelijke fouten te achterhalen. Mocht de conversie als absoluut noodzakelijk worden gezien dan wordt in ieder geval aangeraden de originele PDF te bewaren. Lees meer over de moeizame PDF naar PDF/A conversie in de Open Planets blog When (not) to migrate a PDF to PDF/A.

Dit is een nuancering van hetgeen je schrijft.

Met Yvonne ben ik het eens dat er in het werkveld meer kennis over verschillende mogelijkheden rondom het bevorderen van digitale duurzaamheid. Onzekerheden horen daarbij; schijnzekerheden ook.

Zowel aan het gebruik van PDF als XML kleven voor- en nadelen.

@Luc Helemaal met je eens: "Ik denk dat die weg inslaan meer gaat opleveren dan overal maar PDF van maken, 'omdat voor bewijsvoering papier ook nog steeds geaccepteerd wordt'. 

 

@Jack. Wie garandeert dat? nou ondermeer de wereldwijd opererende ISO organisatie bijvoorbeeld. Deze garandeert dat de broncode en specificaties voor een reader van PDF/A bestanden "altijd" voorhanden zullen blijven.

Maar  over de discussie in het algemeen. Ik neem aan dat we het allemaal eens zijn dat het bewaren van digitale documenten in hun native formaat zoals in een van de Microsoft formaten een gegarandeerde route is naar digitale vergetelheid. Wereldwijd is gekozen voor adoptie van PDF/A als minst slechte van alle voorhanden zijnde beschikbare en open bestandsformaten. Waar je ook voor kiest er zijn altijd voor- en nadelen. De komst van de versie 3 van PDF kwam tegemoet aan dezelfde bezwaren die ook in deze discussie genoemd worden, met als resultaat dat ook daar weer bezwaren aan kleven die voor sommigen zwaarder wegen dan voor anderen. Het is niet anders.

Ik eindigde mijn vorige reactie met een verwijzing naar de "leg uit" situatie op de lijst met gestandaardiseerde bestandsformaten van het Bureau Standaardisatie. Als een archiefvormer een goede reden heeft om niet te kiezen voor een van die geaccepteerde bestandsformaten van die lijst, dus bijvoorbeeld omdat een bestand zich nou eenmaal niet goed laat converteren naar PDF/A dan laat zich dat prima uitleggen en zul je het moeten doen met wat je wel hebt.

De wereld - en zeker de digitale wereld- is niet perfect, maar we blijven doorgaan met onze queeste naar de heilige graal :-)

PDF/a wordt veel toegepast. In de nodige gevallen een bewuste keuze en in andere gevallen 'omdat anderen dat ook doen'. Velen zoeken niet, maar nemen zonder meer aan dat PDF/a die heilige graal is.

http://www.projectcest.be/index.php/PDF_A123
"Bij migratie naar PDF/A kan informatie verloren gaan. De focus van PDF ligt immers vooral op de correcte weergave van het document. Informatie zoals de structuur of verborgen metadata kunnen bij migratie naar PDF/A verdwijnen. Gestructureerde dataverzamelingen (zoals Excel-bestanden) worden dan ook beter omgezet naar een formaat dat de datastructuur bewaart (zoals CSV). Bij het converteren van e-mails naar PDF/A gaat eveneens essentiële informatie verloren. Video, audio of beeld wordt bij een PDF/A ingekapseld in het document maar wordt hierdoor niet duurzamer. Ook hier zijn andere bestandsformaten beter geschikt: raadpleeg daarvoor de CEST-richtlijnen voor digitaliseren."

Mbt muteerbaarheid van PDF/a geldt dat er vrij algemene overeenstemming is dat ook PDF/a muteerbaar is.

En nee, ik ben het er niet zonder meer mee eens dat microsoft-formaten gegarandeerd tot digitale vergetelheid leiden.

Zie ook nog dit http://ingmarbladertenschrijft.blogspot.nl/2012/12/dood-aan-pdf.html

Laten we de discussie niet ingewikkelder maken dan hij als is.

Het CSV* bestand in plaats van een Excel bestand is prima zolang het alleen maar gestructureerde dataverzamelingen betreft. Maar lang niet alle Excel bestanden zijn gestructureerde dataverzamelingen en in die gevallen verlies je essentiële informatie bij opslaan als CSV.

Ingmar Koch's mening is een mening. Op een aantal vlakken ben ik het volkomen met hem eens, zoals bijvoorbeeld het gegeven dat het beheer van digitale archiefstukken minstens zo belangrijk is. Maar als je -zoals de meeste divvers- onder druk staat om tegemoet te komen aan de informatiebehoeften van je organisatie, dan ben je gebaat met structuren die zich ook zo eenvoudig mogelijk laten uitleggen aan gebruikers wiens computer-vaardigheden zich beperken tot de vakapplicaties waar ze in werken en facebook. Daarom zeg ik niet dat alles dan maar hoe dan ook in het PDF/A formaat gepropt moet worden, maar wel als het kan.

____

* CSV staat voor Comma Seperated Value. Wordt gebruikt voor dataverzamelingen waar per regel een record wordt vastgelegd en binnen die regel de oorspronkelijke velden worden onderscheiden door een comma (of een ander bijzonder teken)

Antwoorden op discussie

RSS

© 2024   Gemaakt door Marco Klerks.   Verzorgd door

Banners  |  Een probleem rapporteren?  |  Algemene voorwaarden