Data en ai
Congres

Wanneer is GenAI goed genoeg om erop te vertrouwen?

Thymo van den Brug

Het Datalab van Rijkswaterstaat (RWS) wordt een Data- en AI-lab. Waar nu nog 25 fte aan het werk is, moet dat er de komende jaren 45 fte worden. Het is typerend voor de inzet op innovatieve AI-projecten binnen deze organisatie. Op het gebied van machine learning zijn er al grote stappen gezet. Momenteel onderzoekt RWS hoe generatieve AI (genAI) de collega’s kan ondersteunen om hun werk slimmer en efficiënter te doen. Dat blijkt een hele zoektocht.

In de workshop ‘Van Idee naar Praktijk bij RWS’ bespreken Thymo van den Brug, Marissa Groenewegen en Martijn van Rhoon een tweetal AI-vraagstukken in twee groepen. AI-dilemma één gaat over de uitzetting van bruggen. Een aantal jaren geleden zette de Merwedebrug bij Gorinchem bij hitte zó sterk uit dat hij niet meer bediend kon worden. Met het oog op klimaatverandering is de verwachting dat dit in de toekomst vaker en voor meer bruggen zal gelden. Daarom heeft Rijkswaterstaat een AI-model ontwikkeld dat tien dagen vooruit kan voorspellen wanneer welke bruggen moeten worden gekoeld. Er is een minimal viable product gereed, dat van de voegen van zeven bruggen op 1 à 2 millimeter kan voorspellen hoe breed ze zijn. Indrukwekkend, maar toch blijkt het model lastig te implementeren. Gebruik heeft alles te maken met geloof. Wanneer is een genAI-model goed genoeg om erop te vertrouwen?

Op basis van een open source AI-model test Rijkswaterstaat een beveiligde proof-of-concept op vijftig gebruikers. Sommigen blijken het fanatiek te gebruiken, terwijl anderen nauwelijks inloggen.

Het tweede vraagstuk gaat over ChatRWS, een chatbot waarmee medewerkers vertrouwelijke documenten kunnen uploaden om ze te laten doorzoeken en samenvatten. De behoefte aan genAI voor dit doel is groot binnen de organisatie. ChatRWS is onder meer bedoeld om te zorgen dat medewerkers niet langer hun toevlucht nemen tot ChatGPT.  Op basis van een open source AI-model test Rijkswaterstaat een beveiligde proof-of-concept op vijftig gebruikers. Sommigen blijken het fanatiek te gebruiken, terwijl anderen nauwelijks inloggen. Het (laten) ontwikkelen van een eigen chatbot is niet goedkoop. De vraag is dan ook hoe RWS kan stimuleren dat de medewerkers ChatRWS genoeg gebruiken om een aankoop de moeite waard te maken. Daarnaast staan ze voor het dilemma of ze een product willen inkopen of zelf ontwikkelen.

De sprekers willen weten of de workshopdeelnemers een oplossing zien en of ze dit dilemma herkennen uit hun eigen werk. Dat laatste blijkt zo te zijn. Waar niet iedere overheidsorganisatie de verantwoordelijkheid voor één of meerdere bruggen heeft, is vrijwel iedereen bij de overheid momenteel bezig met (onderzoek naar) een eigen chatbot. Het grootste deel van de deelnemers sluit aan bij het gesprek over dit vraagstuk.

Dat veel overheidsorganisaties los van elkaar een chatbot (laten) ontwikkelen is niet effectief, vindt eigenlijk iedereen. De crux zit er juist in om naar de Nederlandse Digitaliseringsstrategie (NDS) te gaan leven door de krachten te bundelen. Maar alleen al in deze groep zijn de verschillen behoorlijk groot. Er zijn organisaties die voorlopig vertrouwen op Copilot of op een afgeschermde versie van ChatGPT. Anderen beargumenteren dat het beter is om af te wachten tot vlam.ai klaar is. Deze chatbot wordt ontwikkeld door het ministerie van Binnenlandse Zaken op basis van Europese software (vlam staat voor Veilige Lokale AI Modellen). Het kan alleen rustig nog een jaar duren voordat vlam.ai ter beschikking wordt gesteld. Wat doet Rijkswaterstaat in de tussentijd? ChatGPT onder bepaalde richtlijnen toestaan, totdat ze vlam.ai volledig kunnen implementeren? In de tussentijd onder voorwaarden een minder ideaal alternatief toestaan?

Sommigen zien het als een voordeel dat Copilot ongevraagd overal in de Microsoft 365-omgeving opduikt, waardoor gebruikers eraan wennen.

Een ander nadeel van vlam.ai is dat de chatbot niet overheidsbreed kan worden aangeboden, doordat wetgeving voorkomt dat een leverancier zomaar kan leveren aan een gemeente of een ZBO. Tenzij er een manier wordt gevonden om de chatbot via het Gemeentefonds of de VNG gratis aan gemeenten te verstrekken, merkt een deelnemer aan de sessie op.

Hoe stimuleer je het gebruik van genAI? Sommigen zien het als een voordeel dat Copilot ongevraagd overal in de Microsoft 365-omgeving opduikt, waardoor gebruikers eraan wennen. Als organisaties overstappen op een alternatief, zullen ze daar andere wegen voor moeten vinden.

RWS is in ieder geval van plan om 250 licenties voor ChatRWS aan te bieden aan medewerkers die met een goede use case aankomen. Als iemand de chatbot een maand niet gebruikt, gaat de licentie naar iemand anders. De vraag blijft waaróm medewerkers het niet gebruiken. Is het onbekendheid, onwil of een kwestie van vertrouwen?

AI & Overheid

Op 12 november organiseerde iBestuur AI & Overheid 2025. RWS verzorgde een workshop met als centrale vraag: Hoe zorgen we voor betrouwbare veilige en breed geaccepteerde AI-oplossingen die echt gebruikt worden binnen onze organisatie?

Lees meer verslagen van plenaire bijdragen en sessies tijdens AI en Overheid 2025

Plaats een reactie

U moet ingelogd zijn om een reactie te kunnen plaatsen.
Registreren