Overslaan en naar de inhoud gaan
(advertentie)

AI en Open Overheid: lessen van de internationale wetenschap

Man achter laptop houdt vergrootglas voor beeldscherm, ertussen is digitaal zoekproces met hersens geprojecteerd.
Agentic AI is ook toepasbaar in het Woo-proces. - Shutterstock

Al is er een positieve trend, de Woo-praktijk blijft in Nederland tijdrovend, en kostbaar. Maar Nederland staat niet alleen in deze uitdaging: in de VS, het VK, Japan, India, en Zuidoost-Azië kennen overheden gelijksoortige wetten en regels zoals Access to Information Laws, en worstelen ze met soortgelijke uitdagingen. In dit stuk nemen we je in vogelvlucht mee door een paar van deze onderzoeken.

Op de AI & Open Government workshop op 8 juni in Singapore worden diverse onderzoeken op het snijvlak van AI en open overheidgepubliceerd. De workshop is onderdeel van een internationale conferentie over AI en recht. Het is voor het eerst dat deze onderzoeksgemeenschap samenkomt om kennis en resultaten te delen. Op het programma staan 14 wetenschappelijke artikelen van 26 auteurs uit tien landen, van de VS en het VK tot Japan, Estland, Singapore, India en Nederland.

De vraagstukken waar we in de Woo-praktijk mee worstelen zijn dus niet uniek, en internationaal aanhaken loont. Nederland doet daarbij serieus mee: drie van de besproken papers komen uit Nederland, en de onderzoekers staan midden in dezelfde internationale gemeenschap als hun collega's elders.

The future is agentic

Om dan maar te beginnen bij het eind: wanneer we het over AI hebben, kunnen we niet meer om “Agentic AI” heen: zelfstandige AI modellen die – al dan niet in samenwerking met elkaar – taken uitvoeren en zo processen automatiseren. Ook het Woo-proces blijkt hiervoor een dankbare casus, blijkt uit de eerste twee artikelen.

Agentic AI-architectuur

Onderzoekers aan de University of Maryland stellen een Agentic AI-architectuur voor Woo-verzoeken voor. De architectuur bestaat uit vijf agenten die de volgende stappen uitvoeren:

  1. Intake en dialoog met de verzoeker over reikwijdte
  2. Gautomatiseerde zoekslag
  3. Automatisch lakken
  4. Uitleg van de uitkomst
  5. Auditing van de voorgaande stappen

Er zijn met losse AI-componenten al genoeg tastbare, kleinere stappen binnen het Woo-proces aan te pakken

DEPLOY-5

Maar ben je als overheidsorganisatie wel toe aan zo’n ingrijpende implementatie? Een ​​onderzoeker van de University of Phoenix biedt daar een antwoord op met DEPLOY-5: een framework van vijf opeenvolgende checkpoints voor contextdefinitie, bewijslast en evaluatie, veiligheid en controlemaatregelen, monitoring, en accountability. Elk checkpoint vraagt om verifieerbaar bewijs, voordat je door kunt naar de volgende. Het onderzoek levert een concrete compliance checklist op met te operationaliseren criteria; direct bruikbaar bij inkoop of als interne go/no-go-procedure voor agentic pipelines.

Maar als academici het over implementatie van nieuwe technologie hebben, gaat dat meestal over de toekomst. Ook hier: hype ten spijt, de losse AI-componenten zelf zijn nog volop in ontwikkeling, met foutkansen die in agentic pipelines snel kunnen opstapelen. Een risico in de context van de Woo, waar het zoeken en beoordelen van interne documenten extra zorgvuldigheid vraagt. Gelukkig zijn er nu al genoeg tastbare, kleinere stappen binnen het Woo-proces aan te pakken, juist met die losse AI-componenten.

AI voor de overheid: zoekslagen en beoordeling

Dit is misschien wel de meest kostbare stap aan de kant van de overheid: het vinden en beoordelen van documenten. Verschillende onderzoeksgroepen buigen zich over de zoekslag en de beoordelingsstap van het Woo-proces.

De zoekvraag met ArchiveRAG

Onderzoekers van de State University of New York at Buffalo (VS) beschrijven ArchiveRAG, een AI-gebaseerde zoektool voor “moeilijke” archieven vol gedegradeerde scans, microfilm, en gedigitaliseerde handgeschreven documenten. Hun steekproef bij 12 Amerikaanse overheidsorganisaties wijst uit dat 61 procent van de vrijgegeven dossiers daar bestaat uit gescande afbeeldingen zonder doorzoekbare tekst. De oplossing is een combinatie van al bestaande AI-modellen in stappen achter elkaar te zetten:

  1. Optische tekenherkenning (OCR)
  2. Herkennen van handschrift
  3. Corrigeren van fouten uit de voorgaande stappen
  4. Documenten opknippen in coherente segmenten op basis van layout, opmaak en structuur van het document
  5. Effectief doorzoekbaar maken van de segmenten (met een multimodaal AI model dat gebruik maakt van zowel visuele als tekstuele informatie)

Al die losse stappen bestaan uit al bestaande, eerder gepubliceerde, of open source AI modellen, die vervolgens worden toegespitst op eigen, domeinspecifieke data. Dit zogenaamde 'fine-tuning'-proces levert een verbetering op van ongeveer 20 procent. In de evaluatie vindt ArchiveRAG ruim vier op de vijf (relevante documenten bij een zoekvraag, tegenover ongeveer de helft bij traditionele zoeksystemen.

Inhoudelijke beoordeling met Sensitivity-Aware Search-pipeline

Twee artikelen buigen zich over de inhoudelijke beoordeling. De University of Glasgow (VK) presenteert een Sensitivity-Aware Search-pipeline: een zoekmachine die ingebouwde “kennis” heeft van welke informatie gevoelig is. In plaats van één model dat dat beslist, rijgen de onderzoekers drie gespecialiseerde modellen achter elkaar:

  1. Selectie van voor relevante documenten
  2. Filteren van gevoelige passages
  3. Herschikken van het overgebleven resultaat (met gevoeligheid in het achterhoofd)

Zo'n "separation of concerns" is volgens hen zowel op governance- als systeemniveau wenselijk; experimenteel laten ze zien dat deze aanpak tot 64 procent minder gevoelige documenten in de resultaten oplevert, dan een methode waar gevoeligheid niet of slechts in één stap meeweegt.

Inhoudelijike beoordeling met slimme prompting

De Universiteit van Amsterdam kiest tot slot een pragmatische route: de onderzoekers tonen aan dat een klein, lokaal draaiend taalmodel (Qwen 3.5) op consumentenhardware verrassend goed in staat is de Amerikaanse equivalent van “persoonlijke beleidsopvattingen” te herkennen. Met slimme prompting benadert het de prestaties van een groter commercieel model. Dus, geen cloud-API nodig, wat zowel juridisch als politiek te verkiezen is boven grote hoeveelheden interne documenten over de spreekwoordelijke schutting te gooien naar een big tech AI model.

Na het zoeken en beoordelen kunnen dossiers in principe vrijgegeven worden en is de klus bij de overheid geklaard. Maar dan begint het werk aan de kant van de ontvanger: de journalist, onderzoeker of burger die met dat dossier aan de slag moet.

Publieke AI-modellen komen al verrassend ver met het ontsluiten van vrijgegeven dossiers

AI voor de ontvanger

Dat werk begint vaak met de ontvangst van een of meer samengestelde PDF bestanden; soms tientallen of honderden pagina's lang, bestaande uit meerdere, achter elkaar gezette documenten. Twee Nederlandse onderzoeksteams komen elk met een eigen voorstel om zulke grote, samengestelde dossiers toegankelijker te maken voor ontvangers.

Vison Language

Een eerste onderzoek, weer van de UvA, vormt qua aanpak de tegenpool van ArchiveRAG: in plaats van AI-modellen domeinspecifiek te fine-tunen, onderzoeken de auteurs hoe ver je komt zonder enige domein-specifieke aanpassing, met generieke “vision-language” AI modellen, die op basis van zowel visuele als tekstuele informatie werken. Ze evalueren open modellen op twee taken die effectieve ontsluiting helpen:

  1. Herkennen van documentgrenzen binnen samengevoegde dossiers
  2. Detecteren van gelakte passages.

De bevindingen: een generieke VLM is minder accuraat dan taakspecifieke modellen, maar opvallend generaliseerbaar, en, niet onbelangrijk, ook lokaal te draaien op consumentenhardware.

WOOLens

Een tweede onderzoek, eveneens van de UvA, gaat een stap verder en bouwt een geïntegreerde toepassing voor het inzicht krijgen in grote, complexe Woo-dossiers: WOOLens. Het maakt ook gebruik van publieke, grote AI-modellen voor verschillende subtaken, zoals het classificeren van documenttypes, het opknippen van email threads in losse berichten, en het extraheren van metadata zoals datum, verzender, en ontvangers. Dit tonen ze in een interactieve tijdlijn, die navigatie door grote dossiers vergemakkelijkt. De meerwaarde zit hier, naast het gebruik van publiek beschikbare AI-modellen, ook in de zorgvuldig ontworpen UX.

Wat beide onderzoeken laten zien is dat publieke AI-modellen al verrassend ver komen met het ontsluiten van vrijgegeven dossiers, scenario’s waarbij het gebruik van commerciële modellen in principe geen beperking is.

Wacht niet op een one-size-fits-all oplossing, maar kies iets uit het palet aan keuzemogelijkheden

Publiek beschikbare modellen

De oplossingsruimte is breder dan veel AI-discussies suggereren: bijna alle papers bouwen op publiek beschikbare of open source modellen, en combineren die slim, spitsen die soms toe op eigen domein (‘fine-tuning’), of maken juist gebruik van de out of the box-capabilities. Met wat er nu al ligt, kun je dus al een heel eind komen.

En als laatste, het brede palet aan verschillende benaderingen en oplossingsrichtingen voor dezelfde taken brengt kansen: drie verschillende methodes voor het beoordelen van documenten betekent dat er altijd iets past bij verschillende technologie volwassenheidsniveaus of juridische contexten. Wacht dus juist niet op een one-size-fits-all oplossing, maar kies iets uit het palet aan keuzemogelijkheden.

Logo van Workshop AI en Open Overheid
© AI en Open Overheid

AI & Open Government

AIOG 2026 is de eerste plek waar deze internationale onderzoeksgemeenschap bij elkaar komt. Voor wie wil meedenken, aanhaken, of de papers wil lezen, zie aiog.net.

Plaats een reactie

U moet ingelogd zijn om een reactie te kunnen plaatsen.

Hans Donkhorst (op pers. titel) | 3 juni 2026, 11:16

Moeilijke archieven, die term moeten we er in houden.
Het handelen van de overheid kent al structuren vanuit juridisch perspectief. Dat handelen is terug te vinden in selectielijsten, maar die structuur sluit niet aan bij de complexe informatievraag.
Het archief behoort inzicht te geven in het functioneren van het overheidsorgaan, waarbij hoofdzakelijk wordt aangesloten bij bestuurlijk handelen en verantwoording. Aan beide zijn bestuursrechtelijk eisen verbonden die het ontstaan en de bruikbaarheid van informatie vormen. De meer inhoudelijke besluitvorming (uitvoering op persoonsniveau) hoort zelf niet tot het archief, die verantwoording behoort op procesniveau beschikbaar te zijn. Gevoelige informatie is in abstractie altijd verbonden met een proces dat verantwoord kan worden.
De oplossing is niet het verbeteren van het zoeken. De oplossing is om de bestaande eisen aan structuur verder uit te werken, daadwerkelijk te gebruiken en (theoretisch en feitelijk) zichtbaar te maken. De slag die daarop volgt is het loslaten van documentdenken en de overgang te ondersteunen naar relevante informatie ongeacht de vorm.

Melden als ongepast

Door u gemelde berichten worden door ons verwijderd indien ze niet voldoen aan onze gebruiksvoorwaarden.

Schrijvers van gemelde berichten zien niet wie de melding heeft gedaan.

(advertentie)

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in