Verplichte open data standaarden graag!

17 juli 2018

Open data voor lokale overheden zal zonder verplichte standaarden nooit goed van de grond komen. Alle goede bedoelingen van overheden die data beschikbaar stellen, ten spijt.

Het aantal beschikbare open datasets groeit gestaag. Maar de Algemene Rekenkamer constateerde vorig jaar dat er bijna 12.000 datasets beschikbaar waren op het nationale dataportaal data.overheid.nl. Nog geen 10 procent van deze datasets is afkomstig van decentrale overheden. Daarbij zijn datasets van lagere overheden amper bruikbaar. Om open data bij lagere overheden echt goed van de grond te krijgen zijn verplichte standaarden en doorontwikkeling van data.overheid.nl noodzakelijk.

Open data bij lagere overheden heeft wat extra uitdagingen dan andere datasets, terwijl het takenpakket en daarmee het belang van deze overheden alleen maar toeneemt. Stel ik ben een ondernemer die alle Nederlandse laadpalen voor elektrische auto’s wil verzamelen of ik ben een journalist die gemeentelijke subsidies wil analyseren. Wat zijn mijn uitdagingen dan? Ik ga allereerst kijken welke overheden deze data al beschikbaar stellen. Dit resulteert hoogstwaarschijnlijk in de constatering dat een fractie van de overheden deze data actief publiceert. Dit betekent bellen, mailen of Wob-verzoeken sturen om informatie te verkrijgen.

Na een aantal weken wachten heb ik dan hopelijk van alle overheden de gevraagde informatie. Dan begint de volgende uitdaging. Veel overheden voeren dan wel dezelfde taken uit, maar registreren dit op een andere manier en in andere systemen. Dit betekent standaardiseren, waarbij altijd informatie verloren gaat en fouten gemaakt kunnen worden. Tot slot dient het laatste probleem zich aan. Na deze exercitie heb ik eenmalig de informatie verkregen, maar om de set actueel te houden kan ik weer opnieuw beginnen met deze exercitie.

De lokale autonomie zorgt er daarom voor dat hergebruik van open data bij lagere overheden niet makkelijk van de grond kan komen. Met krimpende journalistieke budgetten is de tijdsinvestering te groot en voor een ondernemer is hier amper een business-case op te bouwen. Laat staan hoe lastig het is voor inwoners om met deze informatie aan de slag te gaan. Er zullen maar weinig mensen aan de slag gaan met een geïsoleerde dataset van de gemeente Lingewaard. En het is toch zonde wanneer je als overheid energie gestoken hebt in het ontsluiten van data, maar wanneer er niemand gebruik van maakt.

Belang voor lokale open data

Om deze situatie te doorbreken zijn standaarden vereist. Zo zijn er nu gemeentelijke en provinciale high value datalijsten. Een inspiratielijst met veel gevraagde datasets die overheden kan helpen met het prioriteren van hun open data ontsluiting. Ook zijn er nu al enkele standaarden ontwikkeld. Daar hebben we voor de website waarismijnstemlokaal.nl dankbaar gebruik van gemaakt. Gemeenten konden met behulp van VNG-specificaties de eigen lijst met stembureaus uploaden, waardoor meer dan 100.000 kiezers hun dichtstbijzijnde stembureau konden vinden tijdens de gemeenteraadsverkiezingen van maart 2018.

Maar wat als deze standaarden er zijn voor de belangrijke datasets? Gaan dan alle decentrale overheden deze uit zichzelf gebruiken en publiceren? Momenteel zijn er bijvoorbeeld nog maar 48 gemeenten met een of meerdere datasets op data.overheid.nl. En hoe gaan we garanderen dat deze lagere overheden inderdaad conform de standaarden publiceren en we niet hergebruikers alsnog opzadelen met hardnekkig standaardisatiewerk?

Zonder verplichte standaarden, ofwel ‘pas toe, of leg uit’ standaarden, zal open data voor lokale overheden nooit goed van de grond komen. Alle goede bedoelingen van overheden die data beschikbaar stellen ten spijt. Hier ligt daarom een belangrijke taak voor het ministerie van Binnenlandse Zaken, koepelorganisaties, KOOP en het Forum Standaardisatie. Datasets op high value datalijsten dienen voorzien te worden van verplichte standaarden.

Data.overheid.nl dient hierop ook verder ontwikkeld te worden. Het nationale dataportaal dient aan te geven welke lagere overheden open datasets conform standaarden publiceren. Daarnaast moet data.overheid.nl kunnen valideren of standaarden inderdaad goed gevolgd worden en terugkoppelen aan de overheid wanneer dit niet het geval is. Tot slot dient data.overheid.nl dezelfde datasets te kunnen groeperen en bundelen. Dit om te voorkomen dat een hergebruiker alsnog 380 losse bestanden aan het downloaden is die net een andere naam hebben.

Tom Kunzler is directeur a.i bij de Open State Foundation

Over Tom Kunzler

Lees meer van Tom Kunzler »

Anke de Boer (Civity) | 18 juli 2018, 09:51

VNG Realisatie is in 2017 bezig geweest met het standaardiseren van 5 datasets.
Deze 5 standaarden zijn:
– Stembureaus
– Invalideparkeerplaatsen
– Meldingen openbare ruimte
– Gemeentelijke monumenten en
– Bedrijfsterreinen

Deze 5 datasets maken deel uit van de Praktijkbeproeving Open Data.
Op http://www.dataplatform.nl/hvdl vind je de uitgewerkte standaarden.
Als je je gemeente via de actie op Dataplatform aanmeld en je levert de (gestandaardiseerde) datasets aan, dan zorgt Dataplatform ervoor dat de data op data.overheid vindbaar wordt.

Log in om te reageren ↓
Joep Meindertsma (Argu.co) | 18 juli 2018, 14:38

Sterk pleidooi!

Als mogelijke aanvulling hierop zou het verstandig kunnen zijn om bij het opstellen van nieuwe standaarden direct de overstap te maken naar machine-leesbare standaarden. Zeker wanneer je geautomatiseerd zou willen testen of een dataset voldoet aan een bepaalde specificatie, wordt machine leesbaarheid een eis. De standaarden zelf zouden kunnen worden beschreven in de W3C SHACL standaard, welke ontworpen is om geautomatiseerde validates mee te draaien. Daarnaast bieden machine leesbare standaarden andere voorbeelden: de documentatie kan gegenereerd worden (wat tijd bespaart) en gebruikersinterfaces kunnen direct definities van concepten tonen.

Je noemt ook het bundelen van datasets. Dat is doorgaans niet eenvoudig te doen (zelfs met standaardisatie) dankzij name collisions. Een oplossing voor dit probleem is het RDF model gebruiken. Door in RDF je data te delen, garandeer je dat datasets zonder inspanning kunnen worden gecombineerd. De ID’s zijn dan immers URL’s – en deze zijn altijd uniek. Als bijkomend voordeel van URL’s is het voor hergebruikers dan mogelijk om altijd de meest recente versie van een stuk data op te halen bij de bron zelf – volg simpelweg de URL.

Met andere woorden: zet in op standaardiseren met linked data!

Log in om te reageren ↓

Plaats een reactie Reactie annuleren

U moet ingelogd zijn om een reactie te kunnen plaatsen.
Registreren