Praktijk

CBS plukt vruchten van Open Data API’s

De afgelopen jaren heeft het CBS grote slagen gemaakt als het gaat om het beschikbaar stellen van open data. Dankzij API’s. Wat betreft Dennis Ramondt van het CBS heeft het werken met open data alleen zin als die data ook vindbaar zijn en er waarde in zit voor degene die het wil gebruiken.

Beeld: Shutterstock

Data, data, data. Als er één partij in Nederland is die serieus zicht heeft op veel, heel veel data, dan is dat het Centraal Bureau voor de Statistiek (CBS). De Raad voor de Rechtsbijstand, het RIVM, de Belastingdienst, Politie, DUO, het Verbond van Verzekeraars, Jeugdzorg Nederland, het Kadaster, de Fietsersbond, et cetera: het aantal dataleveranciers van het CBS is immens. In feite heeft de organisatie, opgericht in 1899 en waarbij inmiddels circa tweeduizend medewerkers hun brood verdienen, toegang tot alle registraties van Nederlandse overheidsinstellingen als dat nodig is in het kader van statistische informatie. Tot nu toe wordt er vooral aanbodgestuurd gewerkt aan de hand van vastgestelde programma’s. Bijvoorbeeld vanuit Eurostat (het statistische bureau van de EU), dat jaarlijks opgeeft wat het CBS aan statistieken móet produceren.

Als je, zoals het CBS, werkt met veel data, dan is een stap naar API’s (Application Programming Interfaces) een vrij logische. Dat vindt ook Dennis Ramondt, product owner van het team binnen het CBS dat een nieuwe versie van (de eigen) open data realiseert. “Onze eerste stappen op weg naar een API werden gezet in 2010. De vraag destijds was of wij statistieken op een iPhone konden laten zien. Dat lukte aan de hand van webservices en eigenlijk was dat onze eerste API. Het is een experiment geweest waar wij veel van hebben geleerd. Het belangrijkste leerpunt was dat het uitermate zinvol is om gebruik te maken van open standaarden. Doe je dat niet, dan moet je voortdurend het wiel zelf uitvinden. Dat is niet slim. Een tweede les is dat we geleerd hebben wat hergebruik écht betekent. Dat houdt onder meer in dat de metadata kwalitatief goed moet zijn.”

Open data

Het experiment met de API leidde er toe dat er binnen het CBS flinke metaverbeteringen zijn doorgevoerd. Een slag die een paar jaar heeft geduurd. De vraag die vervolgens relevant was van: ‘hoe nu verder’? “We merkten dat de focus niet meer echt op de presentatie van gegevens lag, maar veel meer op het realiseren van open data. Een belangrijke zet is geweest om dat zelf op te pakken. Zelf open data realiseren. Dat is overigens niet iets dat je ‘eventjes’ doet. Het ontwikkelen van open data gaat in stapjes”, aldus Ramondt, die al snel ontdekte dat oude gewoonten moeilijk uit te bannen zijn. “Op een gegeven moment hadden we een nieuwe versie van onze webinterface, maar was er toch ook nog de wens om oude, vertrouwde functionaliteiten toe te voegen. Het lastige is dat je een webpagina relatief makkelijk kunt vervangen, maar bij een API ligt dat anders. Omdat je werkt met open standaarden is er wel veel hulp, maar tegelijkertijd is het een complexer geheel geworden.”

Dat de (open) data van het CBS over het algemeen in goede aarde vallen, is onder meer te staven aan het aantal gebruikers. Zo kwamen er in mei een half miljoen unieke gebruikers ‘over de digitale vloer’ en Ramondt merkt dat dat aantal nog steeds toeneemt. “Voor een groot deel komt dat ook door intermediairs. Wij weten bijvoorbeeld dat journalisten, data-analisten, maar ook makelaars gebruikmaken van onze open data. Ook zien we dat door steeds meer mensen een Engelstalige tabel ergens opgepakt wordt. Wat we verder weten is dat gebruikers hechten aan twee dingen: data moeten vindbaar zijn en er moet waarde in zitten voor degene die het wil gebruiken”, aldus Ramondt, die aangeeft dat het CBS tot op heden nog niet bovenmatige ruchtbaarheid heeft gegeven voor haar opendatadiensten. “Wij zijn vrij actief op data.overheid.nl (het dataregister van de Nederlandse Overheid) en aanwezig bij gebruikersbijeenkomsten, maar verder doen we geen campagnes of zo. Feitelijk vind ik de huidige versie van onze interface ook nog niet echt klaar voor de massa. Dat moet het wel zijn, want voor API-gebruikers is betrouwbaarheid een erg belangrijke sleutel.”

Wat betreft Dennis Ramondt zijn de voordelen van open data en API’s duidelijk, maar niet altijd direct zichtbaar en uit te drukken in geld. Voordelen zijn er voor burgers (“Zij beschikken bijvoorbeeld bij het kopen van een huis veel sneller over juiste informatie”), maar ook voor bijvoorbeeld organisaties als Randstad (“Die hebben een efficiencyslag gemaakt. Zij hebben anderhalve FTE kunnen besparen door gebruik te maken van de CBS API’s) of het Sociaal en Cultureel Planbureau. “Het SCP speelt onder meer een voorname rol tijdens kabinetsformaties. Waar zij voorheen handmatig een groot aantal datasets moesten verwerken, gebeurt dat vandaag de dag automatisch met behulp van onze API’s. Het heeft als voordeel dat zij veel sneller antwoorden op vragen kunnen leveren en met name bij kabinetsformaties is dat een groot plusplunt.”

API Strategie

Tot 27 maart heeft de Nederlandse API Strategie ter consultatie gelegen, een document waarin beschreven wordt waarom je als overheidspartij of zelfstandig bestuursorgaan (ZBO), zoals het CBS, zou moeten inzetten op het gebruik van API’s. Ook het CBS heeft belang bij een dergelijke API Strategie, ook al zet zij voornamelijk in op één of maximaal twee API’s voor al haar datasets. “Onze API-aanpak is anders dan bijvoorbeeld in het geodomein, waar vrijwel iedere dataset zijn eigen API heeft. Je ziet dan ook dat wij een beetje haaks staan op de wensen vanuit het geodomein, ook als het gaat om deze strategie. Ik merk wel dat beide ‘werelden’ naar elkaar toegroeien. We zoeken ook steeds vaker de samenwerking op. Zo hebben we zelf ook een dataset op PDOK (Publieke Dienstverlening op de Kaart, de verzamelplaats van open datasets van de overheid met actuele geo-informatie). Daar is sowieso een verbinding tussen de twee werelden. Iets anders is de stap naar Linked Open Data, een stap waar met name binnen het geodomein steeds vaker naar wordt gezocht. Die stap is voor ons totaal niet behapbaar. Als CBS hebben we meer dan vijfduizend datasets en op dit moment kunnen we garanderen dat die links tot in de eeuwigheid blijven werken. Op het moment dat we de stap naar Linked Open Data maken, betekent het dat het aantal links groeit naar tachtig miljard. Dat is voor ons niet te beheren en bovendien is er nog geen vraag naar.”

Complexiteit

In de afgelopen jaren heeft Ramondt gemerkt dat het werken met open data verschilt met de manier van werken die tot dan toe gebruikelijk was. “Ik merk het met name nu we bezig zijn met een nieuwe versie van de interface. De lastigheid zit met name in de complexiteit. Het betekent onder meer dat we twee versies naast elkaar hebben draaien. Daarnaast speelt de vraag: ‘Wat neem je wel en wat neem je niet mee?’ Waar stop je met de vernieuwing, met de grensafbakening? De uitdaging zal zijn om het hele spectrum te volgen, maar ik ben ervan overtuigd dat de nieuwe versie een stuk beter aansluit bij de behoefte van onze gebruikers en dat we daar serieuze stappen in zetten. Bijvoorbeeld als het gaat om de vindbaarheid van data. Ook door partijen als Google, die niet bepaald stilzitten. De vraag is waar het eindigt. Dat is moeilijk in te schatten. Ik heb dan ook geen idee hoe de datawereld er over tien jaar uitziet. Wat het CBS betreft zijn wij vooralsnog niet aan het einde van onze mogelijkheden. Dus we zijn klaar voor de toekomst.”

Plaats een reactie

U moet ingelogd zijn om een reactie te kunnen plaatsen.
Registreren