Stel dat er een methode was om razendsnel de beslistermijnen van alle lopende Woo-verzoeken binnen de organisatie te achterhalen. Of om alle informatie uit bouwtekeningen in de gemeente in een oogwenk te categoriseren. Onmogelijk, zegt u. Toch kan het, stelt Martijn Aslander, initiatiefnemer van de pilot informatieautonomie. De pilot onderzoekt hoe overheidsinformatie beter kan worden vastgelegd, geordend en teruggevonden in het bestandsformaat Markdown. ‘Wij zijn hier iets wezenlijks anders aan het doen met informatie dan wat mensen kennen’, zegt hij. ‘En we zijn elke keer stomverbaasd hoe snel het gaat’.
Wordt informatieautonomie de gamechanger voor de overheid?
Een totaal andere omgang met informatie met mogelijk grote gevolgen voor de overheid. Daarom draait de pilot informatieautonomie. Initiatiefnemer Martijn Aslander en ambassadeur van de pilot Kees Verhoeven zijn overtuigd van het potentieel. Onder andere het UWV en de politie zijn onder de indruk.
Informatie zit niet in data, maar in de verbindingen tussen data
Door anders met data om te gaan dan we gewend zijn en de rekenkracht van de computer beter te benutten, kan er veel meer. Dat zegt niet alleen Aslander, dat zegt ook ondernemer en voormalig Tweede Kamerlid Kees Verhoeven, die zich als ambassadeur van de pilot heeft opgeworpen. ‘Ik heb echt het gevoel dat hij de kern raakt’, zegt Verhoeven over Aslanders initiatief. Andere klinkende namen die bij de pilot betrokken zijn, zijn onder meer voormalig regeringscommissarissen Informatiehuishouding Bas Eenhoorn en Arre Zuurmond en cyberveiligheidsexpert Brenno de Winter.
Juristen van het UWV onder de indruk
Nico de Lange, business consultant bij het UWV, houdt zich onder meer bezig met ondersteuning bij de uitvoering van de Wet open overheid (Woo). ‘Door de ongestructureerde manier van informatie vastleggen is rapporteren een handmatige en inefficiënte bezigheid’, zegt hij. Via het programma Informatiehuishouding UWV kwam hij terecht bij de pilot. ‘Om te laten zien wat eenvoudig met AI kan, heeft een van de ‘nerds’ in twintig minuten een analyse laten uitvoeren op de openbare data’, vertelt hij. ‘Het resultaat was een uitgebreid dashboard met doorlooptijden, analyses en voorspellingen, waar een data-analist weken mee bezig zou zijn.’ De afdeling juridische zaken van het UWV was onder de indruk. ‘Een van onze analisten zal dit verder uitwerken.’
Dedupliceren
Om te begrijpen waar het enthousiasme vandaan komt, is een duik in de nog jonge ontstaansgeschiedenis van de pilot noodzakelijk. In het najaar van 2025 bouwde Aslander zijn eigen, hyperpersoonlijke informatiesysteem, ThetaOS. Het eerste uitgangspunt achter dit systeem is dat informatie niet in data zit, maar in de verbindingen tussen data. Aslander noemt dit informatiseren: informatie met elkaar verbinden. De kerngedachte achter zijn informatiesysteem is dat er van alles maar één is, zodat je altijd weet wat het is. Dat legt hij uit aan de hand van een voorbeeld. ‘Ik wilde van Gmail af en daarom haalde ik mijn Gmail-archief binnen, 14 GB aan data. Als je 100 mailtjes op een dag krijgt, dan staat die datum er ook 100 keer in, terwijl er maar één 1 januari 2026 bestaat. Hetzelfde geldt voor namen. Er is maar één Kees Verhoeven, ook al staat hij 9000 keer in mijn mailbox. Ik maak er één Kees Verhoeven van. Er is maar één Groningen. Nou vooruit, er zijn er twee: een stad en een provincie. De provincie is dan Groningen 2. Ik noem dit proces dedupliceren, oftewel rigoureus ontdubbelen. Als je alle data analyseert en zeeft, dan kun je 90 procent weggooien.’
Nieuwe ontdekkingen
Met behulp van het systeem doorzoekt Aslander complete oorlogsarchieven, waarbij hij ontdekkingen doet die betrokkenen steil achterover doen slaan. Pilotdeelnemer en geschiedkundige Monique Brinks van WO2Net zegt: ‘Het systeem diept sporen op die ik zelf nog niet had gezien of nooit had kunnen vinden. Het haalt bijvoorbeeld alle MI5-files op en vindt daaruit allerlei verbanden waarvan Lou de Jong nooit heeft geweten. Ik verwacht dat er de komende jaren heel veel nieuwe ontdekkingen aan het licht komen.’
Machineleesbaar
Het tweede uitgangspunt is dat we doorgaans de verkeerde bestandsformaatfamilie gebruiken, namelijk van bestandsformaten die computers niet zelf kunnen uitlezen. Je hebt bijvoorbeeld Word nodig om een .docx-formaat te lezen en Adobe Acrobat voor een pdf-formaat. Ook open source software valt wat Aslander betreft onder de ‘verkeerde’ formaten, omdat ook hiervoor externe software nodig is om de data machineleesbaar te maken. Een aantal bestandsformaten behoort tot een andere familie, waaronder Markdown, Java, HTML, .txt, JSON en CSV. Omdat de computer deze formaten zelf kan uitlezen, kan de rekenkracht van de computer optimaal worden ingezet. Aslander: ‘Waarom zijn taalmodellen zo snel? Omdat alle AI-partijen hun informatie wel in het outputformaat Markdown bewaren.’ Markdown is een moderne, gestructureerde variant van het klassieke tekstbestand (.txt), waarin opmaak en metadata in het document zelf zijn opgenomen.
De eerste impuls is om te denken dat een organisatie niet zonder Word kan, maar dat blijkt mee te vallen
Het resultaat is een database vol stukjes platte tekst uit verschillende bronnen (een lexicon), waarvan er van ieder onderdeeltje maar één is (entiteiten). Er bovenop komt een laag met optical character recognition (OCR), patroonherkenning uit afbeeldingen van teksten. Met behulp van agentic AI zoekt het systeem volautomatisch naar verbindingen tussen de entiteiten. Een vraag als ‘hoe vaak waren Martijn en Kees in Groningen?’ is daardoor razendsnel beantwoord. ‘In dit proces gaat geen enkele betekenis verloren’, zegt Aslander. ‘En omdat je van alles maar één hebt, houd je maar een paar honderd MB data over.’ Dat gebrek aan gewicht is cruciaal. Het zorgt ervoor dat Aslander complete bibliotheken aan openbare informatie kwijt kan op zijn laptop en toch maar 300 MB kwijt is.
Betrouwbaarheid
Een logische vraag is hoe betrouwbaar de resultaten zijn. Volgens Aslander zit de kracht van agentic AI in het crosschecken van bronnen. ‘Als je meerdere AI-bots loslaat op dezelfde vraagstukken, dan kunnen zij de gevonden informatie uit verschillende bronnen met elkaar kruisen en factchecken. AI kan goed redeneren en afleiden wat wat is.’ Hiervoor gebruikt hij de Command Line Interface (CLI), de onder-de-motorkap-versie van Claude. Het oogt als een MS DOS-scherm uit lang vervlogen tijden. Aslander spreekt zijn vragen in, het systeem antwoordt met geschreven tekst.
Beter zicht op overlap en witte vlekken
‘Martijn is Fellow van de KNVI en agendeert hier een onderwerp dat het vakgebied verbetert. Door de archieven te ontdubbelen, alles uniek te identificeren en niet alleen de data, maar ook de relaties tussen data in kaart te brengen, heeft hij echt iets te pakken. Het geeft een impuls aan professionals om opnieuw naar hun werk te kijken en hun aanpak te verbeteren. Door de manier waarop hij informatie letterlijk zichtbaar maakt, ontstaat ook beter zicht op de overlap én de witte vlekken in de informatie. Door die aanpak zien we dingen die we eerder (nog) niet zagen.’
Wouter Bronsgeest, duovoorzitter van de Koninklijke Nederlandse Vereniging van Informatieprofessionals (KNVI)
Wat maakt dit anders dan retrieval-augmented generation (RAG), het ophalen van relevante informatie door taalmodellen uit interne databronnen? ‘Een RAG kan wel patronen opsporen, maar wat wij doen is veel eleganter: extreem gestructureerd informatie ontwerpen. Mijn dataset is zo gemetadateerd en kent zoveel bewijslagen dat ik erop kan leunen.’ Hij stelt dat slechts twee procent van het systeem bestaat uit AI.
Binnen de pilot informatieautonomie onderzoekt een negenkoppig team samen met diverse overheidsinstellingen wat deze methode de overheid kan opleveren. Onder meer het UWV, de veiligheidsregio’s, de Belastingdienst, de Politie en verschillende archieven doen mee. De pilot wordt bekostigd door de deelnemers. In de eerste pilotfase werd onderzocht of het überhaupt mogelijk is om met de andere bestandsformaatfamilie te gaan werken. De eerste impuls is om te denken dat de eigen organisatie niet zonder Word kan, maar dat blijkt mee te vallen. ‘Iedere keer dat iemand een beer op de weg vond, bleek het probleem oplosbaar’, vertelt Verhoeven. ‘We kunnen bijvoorbeeld prima zwartlakken zonder Word-software.’
Er zijn sectoren voor wie de methode in potentie slecht nieuws is, de consultancybranche voorop
Vrijdenker
Aslander en Verhoeven geloven dat de implicaties gigantisch zijn. Denk aan alle ingewikkelde dossiers waar de overheid mee worstelt, van het aardbevingsdossier tot het Toeslagenschandaal. Aslander zou maar wat graag de onlangs gevonden ‘kluis’ van het Toeslagenschandaal doorzoeken. ‘Ik weet zeker dat mijn team daar in een uur tijd dingen boven water krijgt, waar honderd consultants maanden over doen.’ Wat is ervoor nodig om het systeem bij de overheid ingeburgerd te krijgen? ‘Institutioneel lef. Iemand moet ja zeggen in plaats van nee.’
Voorwaarde voor goed politiewerk
‘De methode-Aslander gaat over een manier van denken en datamodelleren waarin wij als politie zelf meer grip houden op data en informatie. Dat is ontzettend belangrijk. Onze collega’s moeten snel kunnen zien wat er speelt en zorgvuldig kunnen besluiten op basis van betrouwbare informatie. Tegelijkertijd moet de samenleving erop kunnen vertrouwen dat wij zorgvuldig, veilig en rechtsstatelijk met informatie omgaan. Juist daarom is informatieautonomie voor ons een voorwaarde voor goed politiewerk en doen wij mee aan de pilot. Het helpt ons om data en informatie vanuit strategisch perspectief te benaderen. Wij zijn er trots op dat Martijn zich als vrijwillig teamchef aan de politie heeft verbonden.’
Anne Jan Oosterheert, directeur Digitale Transformatie bij de Politie
Blijft de vraag waarom ene Martijn Aslander uit Nederland met zijn team iets kan wat alle goedbetaalde knappe koppen bij Google of Microsoft blijkbaar ontgaat. Daar heeft Verhoeven een antwoord op. ‘De data en rekenkracht hebben ze daar ook, maar Martijn is een vrijdenker, hij denkt niet vanuit een marktmodel.’ Softwareleveranciers hebben er weinig belang bij om data te ontdoen van alle ‘lagen’ waar klanten doorgaans voor betalen. Data in Markdown hoeven niet meer te worden opgeslagen in Word, gemetadateerd in SharePoint of geanalyseerd door Copilot. Voor het Europese streven naar digitale autonomie is informatieautonomie in potentie een gamechanger. Er zijn meer sectoren voor wie de methode in potentie slecht nieuws is, de consultancybranche voorop.
Misbruik?
Is het systeem ook te misbruiken? Wat kunnen geslepen cybercriminelen hiermee? Of wat als Aslander zelf besluit om mensen te chanteren met kennis die hij boven water krijgt? Hij denkt lang na. ‘Ik denk dat mijn rol in de samenleving altijd is geweest om op dit soort technologieën te duiden en te laten zien wat er gebeurt, ook als het ongewenst is. Anders kunnen we niet nadenken over hoe we ons ertoe willen verhouden.’ Verhoeven, naar eigen zeggen iemand die doorgaans geneigd is in risico’s te denken, voelt in dit specifieke geval weinig weerstand. ‘Laten we nu eens met een aantal grote overheidsorganisaties goed gebruikmaken van de mogelijkheden om informatie op een goede manier in te zetten, waardoor je verder komt met minder mensen. Na twintig jaar ICT-ellende bij de overheid vind ik dat een fijn idee.’
Meer informatieautonomie
De pilot informatieautonomie verloopt in fases van een half jaar. De volgende fase eindigt op 30 november. Bij genoeg belangstelling komt er een vervolg.
Op 26 juni is het boek ‘Informatieautonomie’ verschenen. De ontbrekende voorwaarde voor datasoevereiniteit in een tijdperk van vendor lock-in en AI’ van Martijn Aslander.
Dit artikel is ook gepubliceerd in iBestuur Magazine #59
Nog geen (gratis) online abonnement? Klik HIER
Plaats een reactie
U moet ingelogd zijn om een reactie te kunnen plaatsen.
Automatisering en digitalisering hebben de afgelopen decennia al (wettelijke) eisen gesteld aan het functioneren van de overheid. Die eisen gaan (ook) over data in relatie tot uitvoering van taken en bestuurlijk handelen. Zelden zijn die wettelijke eisen geheel nagekomen terwijl de verantwoording daarover onvolledig was.
De wettelijke eisen in relatie tot functioneren en verantwoording vragen ook om inzicht in inrichting en proces, een "soort" informatie die structuur en relaties kent met documenten. Toch geeft het merendeel van de documenten geen (sluitend) zicht / aansluiting op de geldende eisen, de inrichting en de werking, waardoor de verantwoording (proces en resultaat) onvolledig blijft. Dubbelen hebben in het verleden vrijwel altijd - op documentniveau - elk een andere functie gehad, van initiatief, via afstemming tot voorbereiding van en uiteindelijke besluitvorming of kaderstelling / beleid. AI kan die informatiewaarde niet eigenhandig toevoegen, daar is een basis in het (taal)model voor nodig, mede gebaseerd op keuzen over inrichting, handelen en verantwoording.
In de context van de lovenswaardige initiatieven van beide heren, bestaat de noodzaak het wettelijk kader expliciet in relatie te brengen met het geheel aan informatie. Dat betreft niet alleen beslisregels, maar zeker ook (het proces van) beleidsvorming en de data en informatie "in", "bij" en "over" het proces. De theorie en methode is in de EU al beschikbaar en wordt toegepast (Interoperabiliteits Framework).
Het besef ontbreekt dat nakoming van wettelijke eisen ten behoeve van het functioneren en de verantwoording een investering vergt in opzet, bestaan en werking.
Het gehele bestuurlijke handelen moet onder de loep worden genomen om adequaat te worden en via digitale weg aan te sluiten op de veranderende behoeften van politiek en maatschappij. Bestuurders moeten die verandering niet langer zien (en ontwijken) vanuit verlies aan macht, maar omarmen vanuit de vereiste van behoorlijk bestuur.
Hear hear! Mardown is leuk, maar eindelijk eens strategisch inzetten op integraal Data Governance is verstandiger. Niet weer een Silver Bullet, want het gaat er niet om dat Markdown goede resultaten helpt realiseren, maar vooral dat hiermee oud denken (document centrisch) niet wordt aangepakt. Het zou moeten gaan om machine2machine readable data en dan is www.ngsi-ld.nl of JSON-LD handiger.
We zitten in de strategische noodzaak voor een digitale TRANSformatie, dus het gaat om een transformatie van "Papier" naar "Real-time Data" en dat vereist een integrale afstemming tussen 'toegevoegde waarde', technologische realiteit, wetgeving en uitvoering. Dat eist dat organisaties verder kijken dan traditionele document-gecentreerde werkwijzen. Markdown is heel nuttig voor eenvoudige tekstopmaak en documentatie, maar beperkt zich slechts tot content-creatie zonder ondersteuning voor complexe data-interoperabiliteit. Dus blijven onze legacy organisaties gevangen in een statische, mens-georiënteerde aanpak die demografisch niet vol te houden is.
Je ziet ook in de beschreven Use Case: terugzoeken in oude documenten is iets heel anders dan nieuwe Outcome genereren voor nieuwe vraagstukken. De maatschappelijke werkelijkheid verandert nou eenmaal sneller dan traditionele processen kunnen volgen. Data-uitwisseling wordt realtime (AI kent geen pauze). Vertrouwen (Trust) verschuift van papier naar digitale identiteit en dat vereist verifieerbare claims op een intersubjectieve werkelijkheid. Europese wetgeving versnelt interoperabiliteit
De centrale opgave is dus niet een technische gadget uitnutten (zeker leuk) in functie van de digitalisering van bestaande processen, maar samenwerking in een gedeelde digitale en snel granulair dataficerende realiteit.
Tegen die achtergrond biedt JSON-LD (JavaScript Object Notation for Linked Data), zoals gepromoot door NGSI-LD, een veel krachtigere oplossing. Het ondersteunt gestructureerde data die wel machineleesbaar zijn, wat essentieel is voor machine-to-machine (M2M) communicatie. Deze aanpak stimuleert een context-centrische benadering, waarbij data niet alleen gelezen, maar ook dynamisch geïntegreerd en geanalyseerd kan worden over verschillende systemen heen. Integraal data governance zorgt voor een gestroomlijnde datastroom én waarborgt consistentie, beveiliging en compliance. Cruciaal in een tijdperk waar gegevensbescherming en -kwaliteit centraal staan. JSON-LD maakt het ook mogelijk om semantische interoperabiliteit te bereiken, waardoor data contextueel en intelligent gebruikt kan worden in real-time applicaties.
Dus hulde voor de Markdown ... maar de wereld is groter en de noodzaak breder.
Dank aan Hans Donkhorst en Vincent Hoek voor deze reacties. Ze raken aan iets wat ik herken: de verleiding om een gedachtegoed meteen te positioneren in een breder kader dat men al kent. Dat is een begrijpelijke reflex, maar hij mist hier het punt.
Hans Donkhorst beschrijft terecht dat wettelijke eisen structureel niet worden nagekomen, en dat verantwoording onvolledig blijft. Hij noemt het EU Interoperability Framework als een beschikbare methode. Dat klopt. Maar het Interoperability Framework regelt de uitwisseling tussen systemen.
Het regelt niet de leesbaarheid van de informatie zelf. En dat is precies de laag waarover ik schrijf. Wie zijn informatie opslaat in formaten die een computer niet zelf kan lezen, heeft strikt genomen geen informatie in beheer. Hij heeft documenten. Dat klinkt als een semantisch onderscheid, maar het is een operationeel onderscheid met directe gevolgen voor de verantwoording die Donkhorst terecht eist.
Een organisatie die haar eigen bestanden niet kan doorzoeken zonder tussenkomst van een leverancier, kan ook niet snel en volledig verantwoorden wat er in die bestanden staat. Het begint dus niet bij het wettelijk kader. Het begint bij de vraag of de informatie überhaupt leesbaar is voor de organisatie zelf.
Donkhorst schrijft ook dat AI de informatiewaarde niet eigenhandig kan toevoegen, en dat daarvoor een basis in het taalmodel nodig is. Daarmee ben ik het geheel eens, en het is een van de redenen waarom ik zo nadrukkelijk onderscheid maak tussen informatiseren en digitaliseren. Informatiewaarde zit niet in het bestand zelf, maar in de verbindingen die je legt tussen gegevens. Die verbindingen zijn mensenwerk, maar ze worden pas onderhoudbaar en doorzoekbaar als de drager het toelaat. Een PDF laat het niet toe. Een Markdown-bestand wel.
Vincent Hoek stelt dat JSON-LD en NGSI-LD krachtiger zijn dan Markdown, en dat de werkelijke opgave de transformatie is van papier naar real-time data. Ik ben het met hem eens dat JSON-LD technisch rijker is. In het boek schrijf ik ook dat Markdown niet heilig is, en dat er goede argumenten zijn voor HTML als rijker alternatief. De vraag is niet welk formaat het sterkst is in abstracto, maar welk formaat een kenniswerker morgen daadwerkelijk kan adopteren zonder een integratieproject van jaren. Markdown heeft een leerdrempel van een middag. NGSI-LD heeft een implementatietraject van jaren, organisatorische consensus, en specialistische kennis als voorwaarden. Dat maakt het een ander type interventie, gericht op een andere laag van het vraagstuk.
Hoek zegt verder dat document-centrisch denken het eigenlijke probleem is, en dat machine-to-machine communicatie de oplossing biedt. Ik zie dat anders, en niet omdat hij ongelijk heeft over de richting op de lange termijn. Maar de organisaties die deelnemen aan de pilot werken nu met informatie die ze niet zelf kunnen lezen. Ze kunnen hun eigen Woo-verzoeken niet razendsnel beantwoorden. Ze kunnen hun eigen archieven niet doorzoeken. Dat is een probleem dat zich afspeelt op het niveau van de individuele kenniswerker en de individuele organisatie, niet op het niveau van de interoperabiliteitsstandaard. Real-time data-uitwisseling tussen overheidssystemen is een legitieme ambitie, maar hij veronderstelt dat de informatie in die systemen überhaupt klopt, compleet is, en toegankelijk is voor de eigen organisatie. Wie die stap overslaat, bouwt een snelweg op een weg vol gaten.
Er is ook een principe in het geding dat ik wil benoemen. Integraal data governance, hoe nuttig ook, is een aanpak die van bovenaf wordt ontworpen en van bovenaf wordt ingevoerd. Het vereist bestuurlijk draagvlak, budget, een programma, consultants, en jaren. Informatieautonomie begint bij de medewerker die zijn eigen bestanden in een formaat opslaat dat hij zelf kan lezen. Dat is geen alternatief voor het grotere verhaal, het is de voorwaarde ervoor.
Wie de basis niet op orde heeft, kan het grotere bouwwerk niet optrekken. In de pilot zien we dat keer op keer bevestigd: organisaties die de stap naar leesbare formaten zetten, ontdekken daarna pas wat er werkelijk mogelijk is.
De kritiek van beide heren is welkom, want ze laat zien dat het onderwerp serieus wordt genomen. Maar de kern van het bezwaar is telkens dat er grotere en belangrijkere opgaven zijn. Dat klopt. Alleen lossen die opgaven het probleem niet op waarmee de Woo-medewerker van UWV elke dag wordt geconfronteerd: informatie die in principe beschikbaar is, maar in de praktijk onvindbaar.
Dat is het probleem dat wij adresseren. En voor dat probleem is een rijke interoperabiliteitsstandaard niet de eerste stap.