Spraaktechnologie en ethiek

25 november 2020

Spraaktechnologie lijkt dé interface van de toekomst, maar dat roept ook ethische vragen op. Tot hoever willen we gaan?

Aan knopjes draaien is al lang voorbij en gooi die afstandsbediening ook maar uit het raam. Spraaktechnologie lijkt dé interface van de toekomst. De razendsnelle ontwikkeling hiervan roept vragen op waarover we als samenleving nog nauwelijks hebben nagedacht. Hoogste tijd om dat wel te gaan doen.

Typen, klikken, en swipen. Jarenlang hebben wij de taal van de computer moeten leren en nu leert voor het eerst de computer onze taal. Dat is een veel gehoorde belofte bij de ontwikkelaars en aanbieders van spraaktechnologie. Het GPS-systeem in je auto, de spraakassistent op je telefoon, de smartspeaker in je huis. Het zijn allemaal vormen van technologie die op een intuïtievere manier met ons beloven te interacteren: via spraak. Ontwikkelaars presenteren spraaktechnologie dan ook als de interface van de toekomst.

Hoe goed spraaktechnologie luistert en begrijpt wat je zegt, is afhankelijk van hoe duidelijk je praat, omgevingsgeluid, je accent en welke taal je spreekt. Met andere woorden: in welke mate spraaktechnologie je begrijpt, wordt bepaald door hoe ‘helder’ je zelf articuleert, maar hangt ook af van hoeveel data er over een taal, dialect, of accent beschikbaar zijn. Spraaktechnologie is dus lang niet voor iedereen toegankelijk.

Wat door spraaktechnologie wel toegankelijk wordt, is onze stem als nieuwe databron voor bedrijven. Door computers te laten luisteren, geven we ze onze stem. Stemmen bevatten veel informatie. In een telefoongesprek hoor je al snel of iemand een man of een vrouw is, een kind of volwassene, vrolijk of depressief, en of iemand gedronken heeft of niet. Bovendien herkennen via de stem ook met wíe we spreken.

Wetenschappers en bedrijven werken eraan om dit soort informatie ook uit onze stem te halen. Op dit moment wordt zelfs al geprobeerd om via de stem symptomen van COVID-19 te signaleren. Doordat de ziekte invloed op de longen en luchtwegen heeft, kunnen veranderingen in het stemgeluid ontstaan die opgevangen en geanalyseerd kunnen worden. Onze stem als nieuwe databron levert privacyrisico’s op, en de vraag: ‘wat geef ik weg als ik iets zeg?’

Een stem is meer dan een communicatiemiddel. Ze beïnvloedt ons gevoel en gedrag. In een experiment met spraaktechnologie omschreven Nederlandse senioren het hebben van een smartspeaker als: ‘het hebben van een vriendje in huis’. In Amerika, waar een kwart van de bevolking al een smartspeaker heeft, bleken sommige kinderen op school hun klasgenootjes net zo te commandeerden als thuis hun smartspeaker. Een baby sprak als eerste woordje niet papa of mama, maar Alexa, de naam van de spraakassistent van Amazon. Het onderscheid tussen mens en machine wordt steeds moeilijker te maken. Google demonstreerde in 2018 al zijn DUPLEX-functie waarbij een spraakassistent reserveringen kan maken bij een restaurant. De assistent klonk zo menselijk dat ‘hij’ niet meer te onderscheiden was van een mens.

Deze voorbeelden roepen ethische vragen op. Welke mate van toeschrijving van menselijkheid vinden we acceptabel of zelfs welkom? En op welk moment gaat de verwarring duidelijk te ver? Hoe kan spraaktechnologie op een menselijke manier worden ingezet met voldoende aandacht voor belangrijke waarden als inclusiviteit, privacy, betrouwbaarheid en autonomie?
In het rapport ‘Hoor wie het zegt’, roept het Rathenau Instituut op tot het starten van een ethische dialoog over spraaktechnologie. Zo moeten er afspraken komen over het recht op menselijk contact en hoe voorkomen kan worden dat spraaktechnologie mensen in verwarring brengt.

Het is belangrijk dat de overheid, bedrijven en burgers samen bijdragen aan spraaktechnologie die onze samenleving en sociale relaties niet verschraalt, maar juist verrijkt. Spraaktechnologie kan taken overnemen zoals het uitschrijven of vertalen van gesprekken, het beantwoorden van algemene vragen, of het verifiëren van een gebruiker met behulp van stemanalyse. Daarnaast kan het de digitale wereld toegankelijker maken voor groter groepen mensen. Daarbij moeten we dus oog blijven houden voor maatschappelijke en ethische vraagstukken. Alleen op die manier geven we zowel de technologie als de mensen een stem.

Serf Doesborgh is onderzoeker bij het Rathenau Instituut. Hij is medeauteur van het recente spraaktechnologierapport Hoor wie het zegt.

Over Serf Doesborgh

Lees meer van Serf Doesborgh »

Bas Evers (MERLINQ) | 25 november 2020, 14:15

Terechte vragen over een onderwerp waarvan de actualiteit nog niet door iedereen wordt gevoeld. En zoals jullie vandaag tijdens de Voice Lunch zeiden: het risico is ook de kans. Dus hoe kunnen we de vragen agenderen op een manier die de positieve kanten van deze ontwikkeling niet onnodig frustreert?

Log in om te reageren ↓

Plaats een reactie Reactie annuleren

U moet ingelogd zijn om een reactie te kunnen plaatsen.
Registreren