Hoe zorgen we ervoor dat het gebruik van big data en algoritmen legitiem is? Hoe ver kunnen we gaan om de transparantie van algoritmen bloot te leggen? Het zijn vragen die centraal staan tijdens een driegangendiner en waarbij vertegenwoordigers vanuit bedrijfsleven, wetenschap, onderwijs en overheid aanschuiven.
Algemeen Rijksarchivaris Marens Engelhard
De thema’s zijn ingewikkelde kost, maar dat maakt de avond niet minder geanimeerd. “Met dit onderwerp móeten we aan de gang.”
Wereldwijd wordt data gezien als het nieuwe goud. De hoeveelheid beschikbare informatie over personen en processen is de laatste jaren sterk toegenomen. Een steeds groter deel daarvan wordt automatisch geproduceerd. Bijvoorbeeld via internet, sociale media, mobiele telefoons en apps. Vrijwel niets blijft nog ongezien. De data die hieruit voortkomt, is niet alleen voor het bedrijfsleven interessant. Ook de overheid maakt dankbaar gebruik van de kennis die wordt opgedaan door databases te koppelen, door de inzet van (zelflerende) algoritmen en door machine learning.
Deze avond schuiven onder andere de verschillende ministeries, gemeenten, de Belastingdienst, onderwijsinstituten, Google, Rijkswaterstaat en de Raad voor de rechtspraak samen aan tafel om hierover te praten. Terwijl de laatste gasten binnendruppelen, opent Marens Engelhard, directeur van het Nationaal Archief, de avond. Hij vertelt onder meer over de verschillende toepassingen van big data en algoritmen. Bijvoorbeeld voor surveillance, marketing, medische diagnostiek en crowd control. Waardevolle en veelbetekenende mogelijkheden. Tegelijk uit hij ook zijn zorgen. “Hoe redelijk is het bijvoorbeeld dat een computer sollicitanten filtert op basis van een postcode of leeftijd? Of dat een uitkering wordt toegekend door een algoritme? Deze software screent mensen, maar wie screent eigenlijk de software?”
Hoe beter algoritmen werken, hoe moeilijker ze te begrijpen en uit te leggen zijn. Een paradox waarmee alle aanwezige bedrijven en organisaties kampen. En tegelijk de reden waarom het Nationaal Archief dit Diner Pensant organiseert, samen met de ministeries van Binnenlandse Zaken en Veiligheid en Justitie. Engelhard: “Het Nationaal Archief is eigenlijk het nationaal geheugen van de overheid. Wij leggen vast hoe beleid tot stand is gekomen, hoe wetten zijn gemaakt. Transparantie van overheidshandelen is onze verantwoordelijkheid. En dus ook de manier waarop we met big data en algoritmen omgaan.”
Hoewel de voordelen van big data de fantasie te boven gaan, zijn de genoemde risico’s geen luchtkastelen. Een van de grootste zorgen is het vertrouwen van burgers in de overheid. De grootschalige verzameling, opslag en analyse van data door overheden – waaronder inlichtingen- en veiligheidsdiensten – kunnen mensen het gevoel geven dat hun privacy en vrije meningsuiting in gevaar zijn. Terwijl burgers steeds transparanter worden, zijn de profielen, algoritmen en methoden van overheidsorganisaties nauwelijks nog navolgbaar. En daar wringt de schoen.
De menselijke maat
Hoog tijd dus om de hoofden bij elkaar te steken. Aan zeven grote, ronde tafels leren de gasten elkaar kennen. De Universiteit van Amsterdam schudt de hand van het Openbaar Ministerie en IBM maakt kennis met de Raad voor de rechtspraak. Voor steeds meer van hen worden datagedreven analyses en systemen de nieuwe werkelijkheid. Maar veiligheid is een heikel punt. Een praktisch voorbeeld: criminaliteit heeft baat bij big data, dat hebben verschillende opsporingsonderzoeken bewezen. Maar door de complexiteit van de datasets en algoritmen is een goede onderbouwing in de rechtszaal lastig. Zo moeten systemen die gebruikmaken van algoritmische besluitvorming, uitleg kunnen geven over procedures en beslissingen. Lukt dat niet? Dan is het smullen voor de advocaat van de verdachte.
Met veel data omgaan vraagt veel verantwoordelijkheid en integriteit. Just Stam van het ministerie van Veiligheid en Justitie maakt dit duidelijk met een aantal levendige voorbeelden. Zo laat hij een afbeelding zien van een zelfrijdende auto die in volle vaart een splitsing nadert. Hardop vraagt hij zich af: “Onverwachts steken twee mensen over. Links een peuter, rechts een bejaarde. Rijdt de auto zichzelf en zijn inzittenden te pletter tegen de boom in het midden, of kiest hij voor links of rechts? Met andere woorden: komen we straks op een punt dat algoritmen ethische keuzes gaan maken op basis van de data waarmee wij ze voeden?”
De zaal valt even stil. “Het is belangrijk dat we regelmatig op deze manier samenkomen”, vervolgt Stam. Knikkend naar een serveerster: “Om meer dan culinaire redenen. Op de een of andere manier moeten we ervoor zorgen dat dit onderwerp begrijpelijk blijft voor de mensen in het veld en aan de top. Voor de mensen die hiermee te maken hebben. Het duurt écht niet lang meer totdat dit voor ons allemaal geldt.”
Hij geeft nog een voorbeeld, ditmaal uit de Verenigde Staten. Daar werd een tijd geleden een jonge man veroordeeld tot zes jaar gevangenisstraf na het rijden in een gestolen auto. De rechter kreeg hulp bij zijn beslissing van een systeem dat onder meer eerdere veroordelingen van verdachten en het risico op recidive meeweegt. De advocaat van de verdachte vond zes jaar wat gortig en daagde de externe partij – die verantwoordelijk was voor het zelflerende algoritme – voor de rechter. De softwareontwikkelaars konden de keuzes van het systeem niet meer uitleggen. Dat had zichzelf al te ver ontwikkeld en veranderd. Absoluut geen ver-van-ons-bed-show, maar een signaal hoe belangrijk het is om als overheid de menselijke maat in acht te houden.
Misschien zijn datascientist en algoritme-accountant wel de beroepen van de toekomst
Ook in Nederland wordt de uitlegbaarheid van data-analyses en algoritmen steeds belangrijker. Net als gegevensherkenning, verantwoording en toetsing. Daarom is meer kennis hard nodig. Aan de tafel van het ministerie van Onderwijs, Cultuur en Wetenschap ontstaat hierover een boeiend gesprek. Samen met de Universiteit Leiden, de Dienst Uitvoering Onderwijs en de Rijksdienst voor Ondernemend Nederland ontstaat een idee. Is het mogelijk een nieuwe opleiding op te zetten of samen te werken bij de werving van mensen? Want misschien zijn ‘datascientist’ en ‘algoritme-accountant’ wel de beroepen van de toekomst.
Verderop in de zaal zitten Google en de Nationale Politie samen aan tafel. Ook hier vliegen de ideeën over en weer. De politie gebruikt bijvoorbeeld niet alleen eigen systemen om verdachten op te sporen, maar ook externe zoekmachines. Open Source Intelligence is een methode om informatie te verzamelen via openbare bronnen. Bijvoorbeeld tekst, foto’s, video’s of audiofragmenten. Het gaat dan vaak om informatie die mensen zelf – bewust of onbewust – op het internet publiceren. Maar hoe kan de politie data via Google verifiëren, als de algoritmen grotendeels geheim worden gehouden? Een interessante hulpvraag waarover Google graag wil meedenken.
Actueel en veelbesproken
“Sjoemelsoftware bestaat niet.” Voordat het dessert wordt geserveerd, vertelt Steven Luitjens van het ministerie van Binnenlandse Zaken en Koninkrijksrelaties over de manier waarop hij naar big data en algoritmen kijkt. “Het afgelopen jaar heb ik me regelmatig gestoord aan de kreet ‘sjoemelsoftware’. Software sjoemelt namelijk niet. Absoluut niet. Mensen kunnen zichzelf niet ontslaan van hun verantwoordelijkheid door software de schuld te geven van eigen fouten. Algoritmen kunnen ons leven enorm verrijken. Zelfrijdende auto’s kunnen het aantal verkeersdoden terugdringen, betere verkoop van advertenties kunnen onze keuzes vergemakkelijken en snellere medische diagnostiek kan de kwaliteit van leven vergroten. Maar dan moeten we wél zorgen dat we genoeg kennis hebben over de mogelijkheden en risico’s.”
Aan het begin van de avond riep Marens Engelhard op om van het Diner Pensant een Diner Activant te maken. Niet alleen praten en onderzoeken dus, maar daadwerkelijk stappen zetten. Dat werpt zijn vruchten af. Tussen de aardbeien en chocoladefondant worden LinkedIn-profielen uitgewisseld en digitale agenda’s getrokken om vervolgafspraken vast te leggen. Bijvoorbeeld om een kwaliteitskeurmerk voor algoritmen te bespreken en om een algoritme voor de rechter te dagen in een gespeelde rechtszaak. Allemaal met hetzelfde doel: grip houden op dit actuele, veelbesproken onderwerp.
Ethiek is overigens niet de enige factor om op door te kauwen als het over big data gaat. Ook de kwaliteit van data speelt een belangrijke rol om het vertrouwen in de overheid hoog te houden. Algoritmen en methoden die bij data-analyses worden gebruikt, moeten kloppen en voldoen aan wetenschappelijke criteria voor goed onderzoek. Dat vraagt aandacht voor kwaliteit en het valideren van resultaten. Op dat vlak vallen nog heel wat vragen te beantwoorden. Denk aan onderwerpen als bewaartermijnen, data-eigenaren en wetgeving. Voor ethisch gebruik moet ook op kwaliteit goed worden toegezien. Betrouwbaarheid en het liefst een minimale foutenmarge. Een van aanwezigen is van mening: “De overheid werkt met technieken van bedrijven. Als we op basis daarvan beslissingen nemen voor burgers, moet het onderliggende algoritme openbaar zijn en de data inzichtelijk. Anders moet je dit als overheid zelf doen.”
Hoe zorgen we ervoor dat het gebruik van big data en algoritmen legitiem is? Het feit dat er veel data is, wil nog niet zeggen dat de overheid alles moet gebruiken. Hoe ver kunnen we gaan om de transparantie van algoritmen bloot te leggen? Hoe bepalen we of de criteria die we opstellen effectief zijn? Waar liggen de grenzen van experimenten? Tijdens het diner zijn veel vragen gaan leven. Roerend in zijn koffie vat een van de aanwezigen een alleszeggend antwoord samen. “De enige manier om daarachter te komen, is door het te doen. Samen aan de gang.”
Heb je inhoudelijke interesse in dit onderwerp? Lees dan ook de publicatie ‘Big data in een vrije en veilige samenleving’
Gesprekken over big data smaken naar meer
De komende tijd staan verschillende vervolgafspraken op de agenda. Zo willen IBM en ICTU, samen met het ministerie van Economische Zaken, onderzoeken of er mogelijkheden zijn voor een promotieonderzoek aan de universiteit van Tilburg over het samenspel tussen algoritmen en menselijke besluitvorming. Kwaliteitsinstituut Nederlandse Gemeenten (KING), de Dienst Uitvoering Onderwijs en de Rijksdienst voor Ondernemend Nederland nemen contact met elkaar op om verder na te denken over de werving en selectie van datascientists. Het ministerie van Onderwijs, Cultuur en Wetenschap denkt erover na om samen met de Dienst Uitvoering Onderwijs een pilot te beginnen op het gebied van studentgegevens. Het Rathenau Instituut maakt een plan voor casestudies. Verder zijn de politie en Google van plan om samen met de Autoriteit Persoonsgegevens opnieuw aan tafel te schuiven om door te praten over veiligheid, het gebruik van openbare data en validatie daarvan.
Op de hoogte blijven? Kijk op de website van het Nationaal Archief