Podium

Informatiebeheer-by-design als standaard

Obesitas en dementie. Woorden die je zou verwachten bij een congres over volksgezondheid, maar die onlangs werden uitgesproken tijdens een bijeenkomst over vernieuwende archiefconcepten. De hoeveelheid informatie die de overheid ontvangt, verwerkt, verstuurt en bewaart stijgt explosief. Tegelijkertijd bestaat er toenemende zorg over de terugvindbaarheid van informatie die - naast in databases - is vastgelegd in documenten.

Beeld: Shutterstock

Recent is een aangepast voorstel voor de Wet open overheid (Woo) naar de Tweede Kamer gestuurd. Afgelopen jaar is veel energie besteed aan implementatie van de Algemene Verordening Gegevensbescherming (AVG) en momenteel wordt gewerkt aan herziening van de Archiefwet. Enkele voorbeelden van hoe vanuit verschillend perspectief steeds hogere – en soms conflicterende – eisen worden gesteld aan de vindbaarheid, toegankelijkheid, duurzaamheid, herbruikbaarheid, openbaarheid en vertrouwelijkheid van informatie.

Deze ontwikkelingen dwingen overheden om vroegtijdig – bij het verzamelen van gegevens en het creëren van documenten – rekening te houden met het toekomstig gebruik. Maatregelen voor verbetering van publicatie, hergebruik, archivering en bescherming van informatie staan daarmee niet op zichzelf, maar dienen in samenhang te worden ontworpen en geïntegreerd met bedrijfsprocessen: ‘informatiebeheer-by-design’.

Het beheer van documenten

Het afgelopen decennium is de verwerking en het beheer van documenten fundamenteel veranderd. Door voortschrijdende digitalisering wordt steeds minder gebruikgemaakt van papier en is de omvang en diversiteit aan digitale documenten enorm toegenomen. Naast tekstbestanden spelen e-mail, WhatsApp-berichten, spreadsheets, afbeeldingen, geo-bestanden, geluid en video een steeds grotere rol.

Tegelijkertijd worden DIV-afdelingen afgeslankt of soms geheel opgeheven. Dat heeft grote gevolgen voor de kwaliteit van de documenthuishouding. Al jaren waarschuwen deskundigen voor gebrekkige dossier- en archiefvorming. Juist in het digitale tijdperk dreigt nu voor het eerst een periode waarin de kwaliteit van de archieven dreigt af te nemen: de ‘digital dark age’. Dat heeft niet alleen te maken met niet-duurzame opslag in verouderde bestandsformaten, maar ook met de kwaliteit van de dossiervorming.

Bij veel overheden bevindt zich maar een deel van de documenten in een ‘gecontroleerde omgeving’ [1]. De rest zit rest in netwerkdirectories of mailboxen van individuele medewerkers. Dit belemmert de vindbaarheid van informatie, de duurzame toegankelijkheid en vormt een risico voor de bescherming van vertrouwelijke gegevens. Is het nodig om alle documenten die in processen worden verwerkt, goed te bewaren en te ordenen? Soms wel, maar vaak ook niet. Denk aan de vele kopieën van documenten, de concepten, kattenbelletjes, et cetera. Maar bijvoorbeeld wel een e-mail met een afspraak met een leverancier. Anders kunnen later discussies ontstaan over levering en kosten.

De dossiervorming is vaak gebrekkig doordat er bij het creëren, bewerken en uitwisselen van documenten onvoldoende gedacht wordt aan wat er later met de documenten gaat gebeuren. Management en medewerkers zijn primair gericht op de rol van informatie in het bedrijfsproces en vaak minder in de beschikbaarheid van informatie voor collega’s, andere overheden, de maatschappij en toekomstige generaties. Digitale dossiers worden daardoor soms slecht geordend en onvoldoende gerubriceerd. Een achterliggende oorzaak is dat de taken van de vroegere DIV-medewerker zijn verschoven naar de uitvoerings- en beleidsprocessen. Het probleem daarbij is dat medewerkers vaak niet de tijd, opleiding of instelling hebben voor het goed ordenen van informatie.

Ontsluiten van overheidsinformatie

Tegelijkertijd met het verschuiven van taken en de onvoldoende tijd, opleiding of instelling, neemt de druk op de overheid toe om overheidsinformatie te ontsluiten. Uit oogpunt van democratische controle, maar vaak ook uit praktische overwegingen. Burgers, bedrijven, instellingen en overheden willen weten welke wetten, beleidsregels, afspraken, beperkingen, enzovoorts er gelden in het publieke domein. Daarnaast is er behoefte aan een diversiteit aan informatie. Daarbij gaat het onder meer om de besteding van middelen, het effect van beleid of harde cijfers over natuur, milieu, veiligheid of migratie. Weliswaar is er al veel informatie, maar vaak is die niet openbaar, vindbaar of betrouwbaar. Vanuit verschillende invalshoeken wordt daarom gewerkt aan het ontsluiten van overheidsinformatie:
• De aangepaste versie van de Wet open overheid die begin dit jaar aan de Tweede Kamer is aangeboden gaat overheden verplichten bepaalde categorieën documenten actief openbaar te maken.
• Het voorstel voor de Wet elektronische publicatie algemene bekendmakingen en mededelingen gaat overheden verplichten om regels en besluiten op één plek digitaal te publiceren;
• In de motie Seegers wordt gevraagd om in de Archiefwet de termijn waarop overheden documenten overdragen aan archiefinstellingen te verkorten van 20 naar 10 jaar, waardoor documenten eerder openbaar worden.
• De Wet hergebruik van overheidsinformatie verplicht overheden om informatie te delen voor de uitoefening van publieke taken.

Publicatie van documenten garandeert nog niet de vindbaarheid

Daarnaast worden vanuit verschillende sectorwetten, zoals de Omgevingswet, allerlei eisen gesteld aan documenten. De consequentie is dat de overheid relevante documenten niet alleen dient te bewaren in een ‘goede, geordende en toegankelijk staat’, maar ook maatregelen moet treffen voor openbaarheid, herbruikbaarheid en vindbaarheid van informatie.

De openbaarheid van overheidsdocumenten wordt nu voor een belangrijk deel geregeld via de Wet openbaarheid bestuur (Wob) en de Archiefwet. Daarnaast is er op grond van de Algemene wet bestuursrecht een publicatieplicht voor bepaalde documenten, zoals wetten, verordeningen en besluiten. De Wet open overheid breidt de publicatieplicht uit.

Publicatie van documenten garandeert nog niet de vindbaarheid. Zonder de juiste metadata over onderwerp, status, et cetera, verdrink je in de documenten. Full-text search, zoals we dat bijvoorbeeld kennen van Google, is lang niet altijd een oplossing, tenzij je exact weet wat je zoekt en weet dat het ergens te vinden is. Verleende of aangevraagde vergunningen worden wel bekendgemaakt, maar de inhoudelijke bijlagen zijn lang niet altijd (eenvoudig) te vinden. Overheden zijn verplicht die informatie ter inzage te leggen, maar dat is omslachtig voor iemand die online op zoek is naar informatie.

Voor hergebruik van overheidsinformatie en open data is de vindbaarheid van een specifiek document niet voldoende. Voor beleidsanalyse, toezicht, verantwoording, et cetera, is het noodzakelijk om informatie uit verschillende bronnen te kunnen combineren. Dit vergt één zoekingang, in plaats van het moeten raadplegen van honderden overheidswebsites. Daarnaast moet er eenduidigheid bestaan over gegevens en metadata (bijvoorbeeld typen vergunningen of beleidsthema’s) om overheidsinformatie te kunnen aggregeren. Het is merkwaardig dat bij een omgevingsvergunning de ene gemeente spreekt van een boom en de andere van een houtopstand. Gegevens en documenten zijn vaak onlosmakelijk met elkaar verbonden, omdat gegevens hun oorsprong vinden in documenten of via documenten worden gecommuniceerd met de omgeving. De hoogte van een belastingaanslag is een gegeven, maar wordt immers medegedeeld via een aanslag – een document. Ditzelfde geldt voor regels, subsidies, vergunningen, uitkeringen, enzovoort. Relevant in dat opzicht zijn ook de eisen rond de bescherming van gegevens. Te publiceren documenten zullen moeten worden gescreend en vertrouwelijke gegevens moeten worden verwijderd of worden ‘weggelakt’.

Tenslotte kan de toegankelijkheid van documenten een beperking vormen. Als documenten op een website worden gepubliceerd zijn ze niet zonder meer toegankelijk voor mensen met een functiebeperking. Daarvoor is het onder meer nodig om de inhoud zodanig te structureren dat gegevens over layout en opbouw expliciet worden gemaakt. Een PDF met platte tekst volstaat in dat geval niet. Het Tijdelijk besluit digitale toegankelijkheid overheid stelt op dit punt eisen aan de content van websites en apps.

Informatiebeheer-by-design

De consequentie is dat overheden bij het verwerken van documenten te maken krijgen met nogal wat vragen:
• Welke documenten zijn straks relevant om te bewaren en hoe lang?
• Welke informatie moet openbaar worden gemaakt?
• Welke gegevens mogen juist niet openbaar worden gemaakt?
• Welke gegevens komen in aanmerking voor hergebruik en door wie?
• Welke metadata moeten worden toegevoegd aan om documenten beter vindbaar, betrouwbaar en interpreteerbaar te maken?
• Welke versie van een document moet officieel worden vastgesteld?
• Welke afspraken zijn gewenst over de structuur van documenten?
• In welk formaat moeten documenten worden opgeslagen?

De realiteit is dat hier op dit moment nog onvoldoende aandacht aan wordt besteed. Documenten opslaan lukt nog wel, maar op de juiste plek, goed geordend, met de juiste structuur, in het juiste formaat en voorzien van de juiste metadata, is een brug te ver. Laat staan dat irrelevante documenten worden verwijderd. Dossiervorming is onderdeel van het primair proces, maar dossierbeheer – het ordenen, classificeren, schonen, beheren en archiveren van documenten – wordt vaak gezien als een administratief vervolgproces waar weinig aandacht en middelen voor zijn.

Feitelijk schuiven sommige overheden hiermee de inspanning voor het beheer van digitale documenten voor zich uit. In het papieren tijdperk was er nog sprake van een natuurlijke rem: de hoeveelheid opslagruimte was in veel gevallen beperkt. Dossiers werden periodiek geschoond of overgebracht naar een archiefbewaarplaats. Met de explosie van digitale informatie vormt een substantiële tijd tussen het creëren en het waarderen van documenten (vernietigen of bewaren) een risico voor de volledigheid en betrouwbaarheid van dossiers. De oplossing ligt dan ook voor de hand. Bepaal al tijdens de dossiervorming wat er straks met documenten gaat gebeuren. Om dit te concretiseren worden de volgende aanbevelingen gedaan.

– Bepaal het eigen beleid van de organisatie naast de bestaande wettelijke verplichtingen. Dat varieert van het vaststellen welke informatie wordt gepubliceerd, tot het opstellen van kaders voor het opslaan van documenten en het gebruik van generieke voorzieningen voor opslag, publicatie, anonimisering, formattering en ondertekening van documenten. Zorg daarbij voor voldoende coördinatie over de verschillende wettelijke verplichtingen heen.

– Communiceer inhoud, reikwijdte en belang van afspraken over zaaktypen, documenttypen en metadata zodat het ordenen en vastleggen van documenten niet gezien wordt als een administratieve last, maar als een noodzaak voor samenwerking, kwaliteit en betrouwbaarheid van informatie en een transparante overheid.

– Betrek documentspecialisten (informatiebeheerders, recordmanagers) bij het inrichten van processen en keuzes over informatiesystemen zodat per bedrijfsproces de samenhang tussen documenten en gegevens wordt geborgd.

– Maak per bedrijfsproces waar nodig afspraken over de structuur van een document, zoals hiërarchie van tekstblokken, gebruik van koppen, toepassen van figuren, betekenis van gegevens en regels (tagging) [2], scheiding van openbare en vertrouwelijke gegevens.

– Bepaal hoe en in welk formaat documenten moeten worden bewaard: het oorspronkelijke muteerbare formaat, een ‘frozen’ format als PDF/A om de authenticiteit te waarborgen, een vorm van XML om betekenis te geven aan de structuur of PDF/UA om documenten geschikt te maken voor toepassingen die gebruikt worden door mensen met een functiebeperking.

Dat betekent dat er van een document meerdere verschijningsvormen kunnen ontstaan. Allereerst de originele versie in het formaat van de bronapplicatie (bijvoorbeeld MS-Word .docx) om (intern) hergebruik in de toekomst mogelijk te maken. Daarnaast de authentieke – vastgestelde – versie in een onveranderbaar formaat en eventueel voorzien van een natte of digitale handtekening. Tenslotte een publicatie-versie die voldoet aan toegankelijkheidseisen en waarbij persoonsgegevens en andere gevoelige gegevens zijn verwijderd.

Betekent dit nu meer werk voor de eindgebruiker? Dat hangt er van af. Bij een goed ingericht proces en dossier kunnen documenttype, documentstructuur en metadata in veel gevallen automatisch worden bepaald. De keerzijde is dat er meer gewerkt moet worden met sjablonen en dat de vrijheid voor gebruikers om zelf teksten op te stellen enigszins wordt beperkt. Dat is wellicht even wennen, maar voorkomt dat collega’s documenten moeten herstructureren en gegevens moeten weglakken om documenten te kunnen publiceren. Door een slim ingericht proces en de juiste documentstructuur wordt de inspanning om documenten te anonimiseren, te formatteren en te publiceren – de ‘nabewerking’ – tot een minimum beperkt.

De rol van de informatiebeheerder verschuift daarmee van uitvoerder naar toezichthouder en adviseur bij de inrichting van proces en dossier [3]. De beheertaak na het afsluiten van een dossier wordt gereduceerd tot het bewaren van documenten, eventueel publiceren en uiteindelijk vernietigen dan wel overbrengen naar een archiefbewaarplaats. Hiermee wordt informatiebeheer een onderdeel van (het ontwerp van) het primair proces. In navolging van termen als privacy-by-design en archiving-by-design spreken we daarmee van informatiebeheer-by-design.

Paul Deurvorst is senior adviseur bij PBLQ; Marco Klerks is records manager bij de gemeente Rotterdam; Dirk Schravendeel is principal adviseur bij PBLQ.

[1] Stand van zaken digitale informatiehuishouding bij gemeenten, ICTU in opdracht van VNG, 2018
[2] Een voorbeeld hiervan is het structureren van regels in omgevingsplannen in het kader van de Omgevingswet
[3] Kwalitatief onderzoek naar de toekomst van de DIV functie bij het rijk, ICTU, 2018

  • Thilde van der Heijden-Bruning, gepensioneerd archivaris | 28 februari 2019, 11:17

    Een herkenbaar verhaal, waarin alle praktische problemen aan de orde komen. Als beheerder bij wie uiteindelijk alles belandt, kom je dit allemaal tegen, als het totale proces onvoldoende is overdacht en gedeeld. Digitale mappen en documenten zijn dan, bij voorbeeld, niet meer te vinden, te beoordelen, te interpreteren enz. omdat ze op een verkeerde manier zijn om-/be-schreven.

  • Martien Naarding | 28 februari 2019, 12:45

    De noodzaak, maar ook kans, om duurzame toegankelijkheid by design te regelen wordt goed duidelijk gemaakt. Bij de aanbeveling om de geschikte bestandsformaten te bepalen voor het (in meerdere instanties) vastleggen van een document heb ik een vraag. Stel je archiveert een authentieke versie in PDF/A en een digitoegankelijke versie in PDF/UA: hoe zorg je er dan voor dat de PDF/UA ook als document duurzaam toegankelijk wordt beheerd? Je wilt immers op termijn ook kunnen verantwoorden dat je wel een goed digitoegankelijk exemplaar hebt gepubliceerd? Kunnen we er van uitgaan dat nieuwe standaarden zoals PDF/UA op zich ook al een duurzaam formaat is en valt binnen de PDF/A-standaard?

Plaats een reactie

U moet ingelogd zijn om een reactie te kunnen plaatsen.
Registreren