Data en ai
Blog

De overheid lijdt aan data-obesitas

Data-obesitas draagt niet bij aan de datagedreven ambities van de overheid. Integendeel, het zorgt voor vervuiling van de datahuishouding, | Beeld: Shutterstock/AI-gegenereerd/FotoSketcher

De afgelopen jaren zijn de productie en opslag van data geëxplodeerd. De honger naar data heeft geleid tot data-obesitas waarbij kwantiteit het vaak wint van kwaliteit. Als gevolg hiervan neemt het risico op datalekken toe en stijgen het energieverbruik en de kosten. Een goed voornemen voor overheden komend jaar is dan ook om wat af te vallen en werk te maken van een gezonde datahuishouding.

Vooropgesteld is het belangrijk dat overheden steeds vaker en slimmer gebruik blijven maken van data. Het verantwoord gebruik van data en kunstmatige intelligentie is onontbeerlijk bij de aanpak van veel complexe maatschappelijke opgaven. Verantwoord betekent echter niet alleen dat het juridisch mag en ethisch wenselijk is, maar ook dat prudent omgegaan wordt met data. Dus niet lukraak verzamelen om vervolgens op meerdere plekken op te slaan, zonder voldoende waarborgen voor de kwaliteit en met het risico dat de data soms zelfs in de vergetelheid raakt.

Het resultaat van data-obesitas draagt niet bij aan de datagedreven ambities van de overheid. Integendeel, het zorgt voor vervuiling van de datahuishouding, wat weer kan leiden tot foutief gebruik van data en ondermijning van het vertrouwen van burgers in de overheid.

Toch lijkt de noodzaak om de eigen data eens tegen het licht te houden nog niet overal te worden gezien. Zo wordt datamanagement nog steeds te vaak gezien als kostenpost en leeft het beeld dat het bewaren van data goedkoper is dan weggooien. Opslag van data is tenslotte ‘bijna gratis’, zeker in de cloud. Hiermee wordt echter een stuwmeer opgebouwd van onbruikbare data. En in plaats van te delen vanuit de bron worden kopieën gemaakt waardoor het stuwmeer ook almaar groter wordt.

Het is niet voor niets dat Europa digitalisering en duurzaamheid hand in hand laat gaan.

De kans dat daardoor fouten gemaakt worden, bijvoorbeeld door gebruik van foutieve data of een datalek neemt dan ook exponentieel toe. De herstelkosten daarna zijn vaak vele malen hoger dan de investering die nu nodig is om te zorgen voor goed datamanagement en het inrichten van data governance, als voorwaarde voor een gezonde datahuishouding. Bovendien leidt de opslag, het doorzoeken en het gebruik van die enorme hoeveelheid data voor bijvoorbeeld de ontwikkeling van slimme algoritmes tot steeds meer energieverbruik en een negatieve impact op het milieu en duurzaamheid. Zo stelde het Rathenau Instituut enige jaren geleden al dat data niet alleen maar goud zijn, maar soms ook het nieuwe plastic.

Het is dan ook niet voor niets dat Europa digitalisering en duurzaamheid hand in hand laat gaan. Zo stelt de eind vorig jaar aangenomen AI Act niet alleen eisen aan privacy en data governance, maar ook aan duurzaamheid. Komend jaar zal het hoe dan ook vaker gaan over de footprint van ons datagebruik, en daarmee hopelijk ook over goed datamanagement als voorwaarde om wat fitter te worden.

  • Vincent Hoek | 8 januari 2024, 14:03

    Goed punt! Nou doen, alleen laten we dan ook meteen anders naar organisaties kijken. Zijn zij vanuit een data ecosysteem gedachte nu Data Eigenaar, Data Leverancier of Data Consument? Anders gaan we slimme tech inzetten op de CONTENT en missen we de kans om meteen meer waarde te persen uit de data CONTEXT. Door te gaan denken in Data Spaces kan de footprint van datagebruik enorm verkleind worden door verschillende methoden, die elk gericht zijn op het efficiënter en effectiever gebruik van data. Denk aan:

    1. Gegevenscentralisatie: Door data te centraliseren in een enkele, goed beheerde omgeving, kan redundantie worden verminderd. Dit betekent dat er minder kopieën van data zijn, wat de hoeveelheid opslagruimte die nodig is, vermindert en daarmee de ecologische voetafdruk van de dataopslag.
    2. Data Cleaning en Deduplicatie: Door data te zuiveren en duplicaten te verwijderen, wordt alleen de noodzakelijke data bewaard en gebruikt, waardoor de hoeveelheid data die verwerkt en opgeslagen moet worden, vermindert.
    3. Efficiënte Dataopslag: Door gebruik te maken van geavanceerde opslagtechnologieën, zoals compressie en deduplicatie op opslagniveau, kan de hoeveelheid fysieke opslagruimte die nodig is voor data worden verminderd.
    4. Cloud-gebaseerde oplossingen: Het gebruik van cloud-gebaseerde diensten kan helpen de data footprint te verkleinen door middel van schaalbare, gedeelde infrastructuur die efficiënter gebruik maakt van energie, vergeleken met traditionele on-premise datacenters.
    5. Energiezuinige Datacenters: Het kiezen voor datacenters die gebruik maken van hernieuwbare energiebronnen of die zijn geoptimaliseerd voor energie-efficiëntie kan de milieu-impact van de benodigde energie voor dataopslag en -verwerking verminderen.
    6. Slimme Data-analyse: Door geavanceerde analysemethoden te gebruiken, zoals machine learning en kunstmatige intelligentie, kunnen bedrijven inzichten verkrijgen uit grote datasets zonder alle data te hoeven verwerken, wat energie en verwerkingskracht bespaart.
    7. Dataminimalisatie: Organisaties kunnen beleid en procedures implementeren die ervoor zorgen dat alleen de meest noodzakelijke data wordt verzameld en opgeslagen, wat de hoeveelheid data die onderhouden moet worden, vermindert.
    8. Groene IT-initiatieven: Het toepassen van groene IT-principes, zoals energiezuinige servers en koelingssystemen, kan de algehele energieconsumptie van IT-infrastructuur en data-gerelateerde activiteiten verminderen.

Plaats een reactie

U moet ingelogd zijn om een reactie te kunnen plaatsen.
Registreren