Het aanstaande regeerakkoord moet werk maken van data en met concrete plannen komen op het gebied van de digitale infrastructuur, datavaardigheid en veilig en verantwoord datagebruik. De komst van een vaste Kamercommissie voor digitale zaken biedt geen antwoord op de lacune voor dit onderwerp in de politieke programma’s en het debat.
Er is een mindshift nodig om data de aandacht te geven die het verdient.
Data kan leiden tot het ruïneren van de levens van onschuldige burgers en de val van een kabinet. Data kan ook leiden tot een betere aanpak van grote maatschappelijke opgaven en een enorme groei van de welvaart. Om beide redenen is het cruciaal dat data een speerpunt wordt in het volgende regeerakkoord. Op dit moment lijkt data echter nauwelijks een thema in de aanstaande verkiezingen en de politieke programma’s.
Net voor de kerst nam de Tweede Kamer zonder veel rumoer het wetsvoorstel gegevensverwerking door samenwerkingsverbanden (WGS) aan. Een brede kaderwet om data van overheden en bedrijven te koppelen voor de opsporing van fraude, criminaliteit en ondermijning. Het was het sluitstuk van een jaar waarin data en politiek meer dan ooit verstrengeld raakten.
Op dezelfde dag dat de WGS door de Kamer werd aangenomen werd ook het rapport ‘Ongekend Onrecht’ aangeboden. Het rapport over de toeslagenaffaire laat weinig heel van hoe de overheid data en profilering heeft ingezet en waarmee grote schade en leed is aangericht bij burgers. Bijna een jaar geleden gaf ook de rechter al forse kritiek op hoe overheden data inzetten bij het opsporen van fraude met het Systeem Risico Indicatie (SyRI), en beoordeelde het zelf als onrechtmatig.
Bij goed gebruik kan data echter ook een enorme maatschappelijk waarde hebben. Zo draagt data bij aan een betere aanpak van complexe opgaven op het gebied van het klimaat, schuldenproblematiek en de gezondheidszorg. Ook is het hebben van goede data cruciaal gebleken bij de aanpak en indamming van corona. Daarnaast is data de voedingsbodem voor nieuwe bedrijvigheid en een belangrijke katalysator voor de groei van de digitale economie, waarvan de Europese Commissie de waarde in 2025 schat op €829 miljard.
Om die waarde te realiseren is wel het vertrouwen nodig van burgers, die daarvoor meer autonomie en zeggenschap moeten krijgen over hun eigen data. Er is sturing nodig om eigenaarschap en kwaliteit van data te borgen. Er is een eenduidig juridisch kader nodig om duidelijkheid te krijgen in de wirwar van regels. En er is een goede digitale infrastructuur nodig om de datagedreven overheid mogelijk te maken. Van dit alles is echter niets te vinden in de meeste verkiezingsprogramma’s.
Daar waar wel aandacht is voor data gaat het vooral over risico’s of beperkt het zich tot de opzet van innovatieve pilots, waarvan de meeste uiteindelijk sterven in schoonheid. Er is een mindshift nodig om data de aandacht te geven die het verdient. Om het niveau van spielerei en het hobbymatige karakter van de meeste pilots te ontstijgen. En om de focus te leggen op wat wél kan en mag, in plaats van de doorgeschoten risicoaversie die nu het debat overheerst en de innovatie verlamt. Zo wordt in de Kamer al snel geroepen om een algoritmeverbod en was Nederland bij de aanpak van corona één van de weinige landen in Europa waar telecomdata niet gebruikt mocht worden door de zeer strikte uitleg van de privacywetgeving.
Het grootste risico is dan ook dat we de kansen en de maatschappelijke waarde van data niet realiseren. Het aanstaande regeerakkoord moet daarom werk maken van data en met concrete plannen komen op het gebied van de digitale infrastructuur, datavaardigheid en veilig en verantwoord datagebruik. Dit vereist dat het onderwerp data ook prominenter op de politieke agenda komt. De komst van een vaste Kamercommissie voor digitale zaken is een stap in de goede richting, maar biedt geen antwoord op de lacune voor dit onderwerp in de politieke programma’s en het debat.
Naast dat er een imago probleem is met algoritmes, is het ontbreken van deskundigheid op regeringsniveau en meer algemeen in de politiek, een groot probleem. Ook de miskleun in de toeslagen affaire doet het imago van algoritmes geen goed. Het voert te ver om in deze reactie een uitgebreide analyse van de verbetering van de kwaliteit van algoritmes te geven. Ik beperk me daarom kort tot 2 aspecten (misschien iets voor een heel artikel) van de problemen rond het gebruik van algoritmes. Het ene aspect heeft betrekking op de kwaliteit van het algoritme zelf. Een algoritme moet aantoonbaar betrouwbaar zijn, bijvoorbeeld om onafhankelijk van het algoritme een model wordt ontwikkelt dat de uitkomsten van het algoritme toetst. Het andere aspect heeft betrekking op de data zelf en vooral om er voor te zorgen dat afhankelijkheden tussen variabelen niet vertaald worden in causaliteiten, en het vaak aan te bevelen is om afhankelijke variabelen te vermijden.
Hans, Een algoritme wordt gebouwd met een training / validation set en een uitleg van de te verwachten resultaten gedurende de operatie (Crisp-dm). In de bouw zie een evaluatie stap. De feature selectie is een stap om ongewenste afhankelijkheden er uit te halen.
Bij de toeslagen affaire wordt over algoritmes gesproken, ik heb ze nog niet gezien.
Het ging daar mis in
a/ de gewone massale verwerking met een uitval door incorrecte en foutieve gegevens.
b/ de foute wetgeving (Awari en wet toeslagen – voorschotten)
c/ Het menselijk handen bij herkennen duidelijke fraude oa “De parel”, “Appelbloesem”
Wat er gewoonlijk ontbreekt in een operatie waar de hulp voor beslissingen via ML ingezet wordt is een evaluatie stap in de operatie waarmee je daar het gedrag en de resultaten / uitkomsten volgt van dat ML model.