'Samen het gegevenslandschap harmoniseren.' Zo luidde de titel van het alweer het derde symposium over gegevensmanagement, georganiseerd door de Expertgroepen Gegevensmanagement van NORA en GEMMA. Een titel met een brede lading, aldus Wim Stolk, voorzitter van de Expertgroepen.
Afbeelding van Gerd Altmann via Pixabay
Het gaat immers om harmoniseren en om het bouwen van een ecosysteem waarbinnen partijen kennis delen en het samen doen. De sessies liepen uiteen in inhoud en abstractie: van wendbaar wetgeving en holistische data-architectuur tot community gegevensmanagement en een handvat om kwaliteit en ethiek in big data projecten goed te regelen.
Vertrekpunt
“Datagedreven en datagestuurd werken is – ook – bij de overheid enorm in ontwikkeling. De basis onder alle gegevens is het gegevensmanagement. En daar knaagt het; dat hebben we nog niet op orde,” stelt Stolk. “We lopen een race terwijl onze veters nog los zitten. Vandaar harmoniseren. Harmoniseren betekent actief samen ontwikkelen en delen; van standaarden, informatiemodellen, architectuur. En daarbij moeten we dezelfde taal gaan spreken, dezelfde normen en dezelfde governance hanteren. Gegevens zijn als een commodity, het lijkt vanzelfsprekend dat het er is. Maar het is ontzettend moeilijk om er grip op te krijgen. Dat is keihard werken. Met elkaar, we zitten immers allemaal in dezelfde wedstijd.”
Deelnemer aan die wedstrijd is ook Raymond Alexander, namens team VNG Realisatie waar hij binnen het managementteam verantwoordelijk is voor de doorontwikkeling van Common Ground: de inrichting van een nieuw informatielandschap met een toekomstbestendige gemeentelijke ICT-infrastructuur. Nu is het momentum om de gegevensvoorziening naar een hoger plan te tillen. Waarbij we ons moeten realiseren dat processen volatiel zijn en gegevens stabiel. Als we inwoners en ondernemers echt regie op gegevens willen geven moeten we met proven technology de data loskoppelen van applicaties. Dat begint onder de motorkap, bij de onderste laag: door gegevens te standaardiseren en standaard informatiemodellen te ontwikkelen.
Eric Brouwer, hoofd architectuur van ICTU, loopt wat dat betreft een marathon om maar in de analogie te blijven. Een werkleven lang is hij al bezig met het thema gegevens en de overheid. Hij ziet een positieve ontwikkeling: van gegevensbeheer naar gegevensmanagement. Gegevens zijn immers de bron van onze informatievoorziening; informatie die we gebruiken om maatschappelijke vraagstukken aan te pakken. Goede modellen en tools helpen daarbij, zoals het Vijflaagsmodel van NORA. Waarbij het niet sec over automatiseren gaat, maar om samenwerken. Er is veel tijd te winnen door het hergebruiken van goede definities en -modellen, bijvoorbeeld die van het Kadaster. En organisaties zouden elkaars gegevens moeten kunnen hergebruiken. Niet via copy-paste, maar met gebruik van Linked Data. Op die manier kunnen we ook nieuwe registraties opzetten. Ik voorzie dat in 2025 de toegang tot gegevens geautomatiseerd en in de cloud geregeld gaat worden. Maar het regisseren van die gegevens, dat zullen we altijd zelf moeten blijven doen.
Onderweg
De ruim tweehonderd deelnemers aan het symposium konden zestien sessies bezoeken waar ze bijgepraat werden door specialisten van overheden, kennisorganisaties en databureaus. Daar bleek maar weer waar we het in het relatief jonge vakgebied gegevensmanagement allemaal over hebben. Van privacy tot archiveren en van ethiek tot wetgeving. Welke parcours kunnen we uitzetten onderweg naar een eenduidig gegevenslandschap? We lichten er sessies drie uit.
Van ‘datagedreven’ naar ‘databedreven’
Martijn Evers van i-Refact noemt zichzelf holistisch data-architect. Wat hem betreft staat de menselijke waarde centraal en moeten organisaties van gegevensgestuurd naar het besturen van gegevens. Waarbij het ook letterlijk om de besturen gaat. Bestuurders moeten meer grip op en begrip van data krijgen. Dan kunnen zij hun organisaties van datagedreven naar databedreven brengen. Maar daar moeten ze bij geholpen worden. Dat kan door patronen te laten zien, bijvoorbeeld met het Datakwadrantenmodel van Ronald Damhof, waarmee je overzicht en controle op de data kunt krijgen. Kortgezegd staan in kwadrant 1 aangeleverde gestructureerde data, in kwadrant 2 de context, in kwadrant drie de ongestructureerde data, en in kwadrant 4 de methoden om van de data informatie te maken. Elk kwadrant heeft een eigen dynamiek en bestuur en ze beïnvloeden elkaar. Je moet steeds de keuze maken waar je op in moet zetten. En waar de balans ligt tussen flexibiliteit en kwaliteit. Waarbij je constant te maken hebt met data-entropie: gegevenschaos, die is er altijd en zul je voortduren moeten beteugelen. Als bestuurder bepaal jij de kwaliteit en moet je die entropie dus kennen.
Een goede start: kwaliteit en ethiek van gemeentelijke big-dataprojecten
Liesbet van Zoonen is academic director Leiden-Delft-Erasmus Centre for BOLD Cities. Ook gemeenten ‘willen wat’ met big data zegt zij met een knipoog. De vraag is vaak: hoe moet je starten? Grote gemeenten zijn volgens Van Zoonen al aardig op weg, maar veel kleinere gemeenten worstelen nog met die vraag. Het Centre for BOLD Cities heeft daartoe een stroomschema ontwikkeld dat bedoeld is om gemeenten te helpen bij het opzetten van big-dataprojecten met oog voor ethiek en kwaliteit. Dat schema voert langs vier elementen met de bijbehorende kaders: wettelijk kader, de kwaliteitseisen, publieke waarden, projectpartners.
Bij wettelijk kader stel je als eerste de vraag: ga ik persoonsgegevens gebruiken? Dat lijkt een eenvoudige vraag, maar het antwoord ligt niet altijd voor de hand. Gelden socialmediaberichten als persoonsgegevens? Zijn bedrijfsgegevens persoonsgegevens? De antwoorden bepalen of het project onder AVG valt en of het doorgang kan vinden. Vervolgens ga je naar de kwaliteitseisen. Is de data-inzet valide en betrouwbaar? Zijn mijn data bijvoorbeeld FAIR (findable, accessible, interoperable, reusable)? Is mijn algoritme transparant? Stap drie, publieke waarden, is minder eenduidig. Er zijn projecten waarbij het voldoende is dat ze aan de wet en de kwaliteitseisen voldoen. Maar zeker bij gemeenten kan het van groot belang zijn dat een project voldoet aan de publieke waarden; waarbij ik meteen zeg dat het debat over wat dat precies is nog lang niet klaar is. Maar je kunt je voorstellen dat als het om sensoren in de publieke ruimte gaat, of over uitkeringsgerechtigden, dat je dat wilt toetsen aan bijvoorbeeld de Spelregels voor de digitale stad van de VNG of aan de adviezen van het Rathenau Instituut over digitale mensenrechten. Daarom is het ook nodig om de eindgebruikers bij je ontwerp te betrekken.
Ten slotte kom je bij de stap van de partners: doe je het alleen als gemeente, betrek je er een commerciële partner bij, of beide? Uiteraard streep je daarbij voortdurend de voor- en de nadelen tegen elkaar af. Maar vóór dit alles ligt nog de belangrijkste vraag: wat is je doel met dit project, heb ik wel gegevens nodig om dat doel te bereiken en zo ja, welke? En na stap vier volgt een even grote vraag: hoe ga je het organiseren – een uitdaging op zich. Maar het doorlopen van het stroomschema zorgt er in elk geval voor dat de basis op orde is zodat je daadwerkelijk kunt sturen. Wat we met dit schema willen zeggen is: realiseer je waar je doorheen moet en doe het vooral netjes.
Linked Open Organizational Knowledge (LOOK)
Banken kunnen het, touroperators kunnen het, dus de overheid moet het ook kunnen: het gegevensverkeer standaardiseren tot één overheidsbreed gegevensverkeer in plaats van verschillende stromen in verschillende domeinen. Jaap van den Berg, enterprise-architect bij DUO vindt dat het tijd wordt en presenteert daartoe het LOOK-concept. LOOK organiseert de eenduidige gegevensuitwisseling tussen overheden en tussen overheden en burgers. Doel van het kennismodel is om van een beoogd maatschappelijk effect (geregeld in de wet) naar het bereikte maatschappelijke effect te gaan (bijvoorbeeld een beschikking). En dat via een universeel gecodeerd patroon van gegevensverkeer waarin vaste rollen en actoren zijn gedefinieerd.
Een rol is bijvoorbeeld ‘gemachtigde’ of ‘organisatie’, een voorbeeld van een actor is ‘belanghebbende’ of ‘verstrekker’. Per situatie kunnen de rollen wisselen en afhankelijk daarvan bepaalt het model of aan het eind van de keten in het geval van een beschikking er toegekend wordt of niet. Dat gebeurt dan langs de lijn beslissing > besluit > beschikking. Van den Berg ziet een analogie tussen DNA van het menselijk lichaam en de codon voor gegevensverkeer. DNA is een betrouwbaar systeem dat al miljarden jaren voor gelijk gedrag in ons lichaam zorgt. De codon voor een universele code zorgt voor gelijk gedrag in ketens en netwerken en uiteindelijk tot één overheidsbreed gegevensverkeer. Met als resultaat dat belanghebbenden een samenhangende overheid zullen ervaren.
Finish in zicht: hoe nu verder?
Terugkijkend op het symposium komt Wim Stolk met de volgende conclusie: “Met de handreiking vanuit de Expertgroepen Gegevensmanagement voor een standaard governance voor overheden hebben we in de NORA en GEMMA de juiste stappen vooruit gezet. Dat was de aanleiding voor het organiseren van dit symposium: wij trekken gezamenlijk op terwijl wij het landschap willen harmoniseren. Met inhoud van de verschillende sessies hebben we van strategisch tot op operationeel niveau laten zien dat we op alle vlakken kunnen verbinden en open staan voor het doorontwikkelen van gegevensmanagement. Dat daar nog veel is te doen is geen geheim; met de expertgroepen bieden we het platform om hier aan door te werken.”