Hergebruik van open data neemt jaarlijks toe, maar toch is het beschikbaar stellen van goed herbruikbare data nog niet zo makkelijk. Wat zijn de belemmeringen én oplossingen?
Open data en hergebruik gaan hand in hand. Zonder hergebruik heeft open data meestal geen waarde. Maar zonder hergebruik zullen overheden en publieke instellingen ook weinig geneigd zijn data vrij te geven. Een dillema, dat vraagt om oplossingen. Die zijn er ook.
Geen enkele ambtenaar wordt blij van moeite doen om vervolgens het eigen dataportaal te zien veranderen in een open datakerkhof. Gelukkig neemt hergebruik van data elk jaar toe, maar kan het de verwachting nog niet waarmaken. Tijd voor een verklaring en gezond verwachtingsmanagement.
Hergebruikers, veelal programmeurs, developers of data-analisten, kunnen veel. Maar het kunnen werken met XML-bestanden of het kunnen doorzien van regels groene code, maakt je nog geen tovenaar. Wat er niet in de data zit, kun je er ook niet uit halen. Uiteindelijk moet de investering die je pleegt in het bruikbaar maken van de data, opwegen tegen de opbrengsten. Een overzicht van vier belangrijke belemmeringen voor hergebruik van data.
Belemmeringen
De eerste belemmering is beschikbaarheid. De meeste datasets worden pas interessant met massa. In Nederland hebben we 388 gemeenten, 22 waterschappen, 11 ministeries en 12 provincies. Deze voeren veelal dezelfde taken uit, maar geven lang niet altijd dezelfde datasets vrij. Voor een journalist die onderzoek doet naar criminaliteit, of een developer die een parkeerroute-app wil maken, is idealiter data van heel Nederland nodig.
Het handmatig opvragen van informatie bij overheden die een bepaalde set nog niet beschikbaar hebben, kost veel tijd. Uit eigen ervaring weet ik dat het ontvangen van een simpele dataset ongeveer honderd werkdagen kost, tijd die je onder meer kwijt bent aan het beantwoorden van mailtjes, het plegen van telefoontjes en het versturen van herinneringen.
Het gebrek aan toegepaste standaarden is een tweede belemmering. Het is fijn dat steeds meer overheden subsidieregisters, bomenregisters of wegwerkzaamheden beschikbaar stellen als open data. Maar zonder standaarden zadel je hergebruikers op met een gigantisch probleem.
Niet elke overheid gebruikt dezelfde velden of veldnamen en registreert dezelfde informatie. Zo moet je altijd handmatig op zoek naar de gemene deler. Dat kost niet alleen tijd, maar daarmee verlies je ook kostbare aanvullende informatie.
Derde belemmering is centralisatie, of beter gezegd: het gebrek eraan. Zelfs met goede beschikbaarheid en standaarden heb je nog een klusje voor de boeg: het vinden van datasets op verschillende overheidswebsites en dataportalen. Niet alle overheden hebben hun datasets al beschikbaar op het nationale dataportaal data.overheid.nl. Wat dat betreft lopen vooral gemeenten achter. In het slechtste geval moet je dan ook naar 388 gemeentelijke websites om te bekijken waar een specifieke dataset te vinden is.
De laatste belemmering is de mismatch. Soms is er simpelweg een mismatch tussen datavraag en aanbod. Overheden registreren niet altijd de informatie waar een journalist, bedrijf of burger naar op zoek is. Dit kan ervoor zorgen dat informatie opgevraagd of beschikbaar gesteld wordt die uiteindelijk niet aansluit bij het beoogde hergebruikdoel. Oftewel een discussie over open data ‘as is’ versus open data ‘as should be’.
Realistischer beeld
De vier bovenstaande belemmeringen dragen hopelijk bij aan een realistischer verwachtingsmanagement wat betreft hergebruik. Het laat goed zien dat het beschikbaar stellen van goed herbruikbare data beschikbaar nog niet zo makkelijk is.
Dat betekent niet dat datahouders en hergebruikers bij de pakken neer hoeven te zitten. Er zijn diverse trajecten gestart om genoemde belemmeringen weg te nemen. Zo komen er steeds meer dataplatformen die automatisch data doorspelen naar data.overheid.nl, werken VNG en KING vanuit een High Value Datalijst aan standaardisatie van gemeentelijke open datasets en verkennen het CBS en het Kadaster de mogelijkheid van een dataknooppunt.
Om deze trajecten te laten slagen, is samenwerking tussen overheden essentieel. Een goed voorbeeld daarvan zijn gemeenten en de provincie in de regio Utrecht die gezamenlijk werken binnen een open dataconvenant. Hergebruikers kunnen dan weer goed helpen bij de totstandkoming van standaarden en overheden kunnen met hergebruikers het gesprek aangaan om te kijken of de mismatch tussen datavraag en aanbod verminderd kan worden.
Tot slot ligt er een belangrijke taak weggelegd voor het nationale open dataplatform data.overheid.nl. Als belangrijkste aggregator van open data kunnen zij meerwaarde bieden door op de goede toepassing van standaarden te checken of extra functionaliteit toe te voegen om dezelfde type datasets van verschillende overheden gebundeld aan te bieden.
Om het hergebruik van open data écht te stimuleren moeten we niet alleen realistische verwachtingen koesteren, maar moeten overheden ook over de eigen grenzen de samenwerking opzoeken. Het klassieke Huis van Thorbecke en lokale autonomie mogen geen excuus zijn om samen niet aan de slag te gaan!
Tom Kunzler is programmamanager politiek en bestuur bij de Open State Foundation