zoeken binnen de website

Spraaktechnologie en ethiek

door: Serf Doesborgh | 25 november 2020

Serf Doesborgh - Rathenau


Aan knopjes draaien is al lang voorbij en gooi die afstandsbediening ook maar uit het raam. Spraaktechnologie lijkt dé interface van de toekomst. De razendsnelle ontwikkeling hiervan roept vragen op waarover we als samenleving nog nauwelijks hebben nagedacht. Hoogste tijd om dat wel te gaan doen.

Typen, klikken, en swipen. Jarenlang hebben wij de taal van de computer moeten leren en nu leert voor het eerst de computer onze taal. Dat is een veel gehoorde belofte bij de ontwikkelaars en aanbieders van spraaktechnologie. Het GPS-systeem in je auto, de spraakassistent op je telefoon, de smartspeaker in je huis. Het zijn allemaal vormen van technologie die op een intuïtievere manier met ons beloven te interacteren: via spraak. Ontwikkelaars presenteren spraaktechnologie dan ook als de interface van de toekomst.

Hoe goed spraaktechnologie luistert en begrijpt wat je zegt, is afhankelijk van hoe duidelijk je praat, omgevingsgeluid, je accent en welke taal je spreekt. Met andere woorden: in welke mate spraaktechnologie je begrijpt, wordt bepaald door hoe ‘helder’ je zelf articuleert, maar hangt ook af van hoeveel data er over een taal, dialect, of accent beschikbaar zijn. Spraaktechnologie is dus lang niet voor iedereen toegankelijk.

Wat door spraaktechnologie wel toegankelijk wordt, is onze stem als nieuwe databron voor bedrijven. Door computers te laten luisteren, geven we ze onze stem. Stemmen bevatten veel informatie. In een telefoongesprek hoor je al snel of iemand een man of een vrouw is, een kind of volwassene, vrolijk of depressief, en of iemand gedronken heeft of niet. Bovendien herkennen via de stem ook met wíe we spreken.

Wetenschappers en bedrijven werken eraan om dit soort informatie ook uit onze stem te halen. Op dit moment wordt zelfs al geprobeerd om via de stem symptomen van COVID-19 te signaleren. Doordat de ziekte invloed op de longen en luchtwegen heeft, kunnen veranderingen in het stemgeluid ontstaan die opgevangen en geanalyseerd kunnen worden. Onze stem als nieuwe databron levert privacyrisico’s op, en de vraag: ‘wat geef ik weg als ik iets zeg?’

Een stem is meer dan een communicatiemiddel. Ze beïnvloedt ons gevoel en gedrag. In een experiment met spraaktechnologie omschreven Nederlandse senioren het hebben van een smartspeaker als: ‘het hebben van een vriendje in huis’. In Amerika, waar een kwart van de bevolking al een smartspeaker heeft, bleken sommige kinderen op school hun klasgenootjes net zo te commandeerden als thuis hun smartspeaker. Een baby sprak als eerste woordje niet papa of mama, maar Alexa, de naam van de spraakassistent van Amazon. Het onderscheid tussen mens en machine wordt steeds moeilijker te maken. Google demonstreerde in 2018 al zijn DUPLEX-functie waarbij een spraakassistent reserveringen kan maken bij een restaurant. De assistent klonk zo menselijk dat ‘hij’ niet meer te onderscheiden was van een mens.

Deze voorbeelden roepen ethische vragen op. Welke mate van toeschrijving van menselijkheid vinden we acceptabel of zelfs welkom? En op welk moment gaat de verwarring duidelijk te ver? Hoe kan spraaktechnologie op een menselijke manier worden ingezet met voldoende aandacht voor belangrijke waarden als inclusiviteit, privacy, betrouwbaarheid en autonomie?
In het rapport ‘Hoor wie het zegt’, roept het Rathenau Instituut op tot het starten van een ethische dialoog over spraaktechnologie. Zo moeten er afspraken komen over het recht op menselijk contact en hoe voorkomen kan worden dat spraaktechnologie mensen in verwarring brengt.

Het is belangrijk dat de overheid, bedrijven en burgers samen bijdragen aan spraaktechnologie die onze samenleving en sociale relaties niet verschraalt, maar juist verrijkt. Spraaktechnologie kan taken overnemen zoals het uitschrijven of vertalen van gesprekken, het beantwoorden van algemene vragen, of het verifiëren van een gebruiker met behulp van stemanalyse. Daarnaast kan het de digitale wereld toegankelijker maken voor groter groepen mensen. Daarbij moeten we dus oog blijven houden voor maatschappelijke en ethische vraagstukken. Alleen op die manier geven we zowel de technologie als de mensen een stem.

Serf Doesborgh is onderzoeker bij het Rathenau Instituut. Hij is medeauteur van het recente spraaktechnologierapport Hoor wie het zegt.

reacties: 1

tags: , , , ,

  • Bas Evers (MERLINQ) #

    25 november 2020, 14:15

    Terechte vragen over een onderwerp waarvan de actualiteit nog niet door iedereen wordt gevoeld. En zoals jullie vandaag tijdens de Voice Lunch zeiden: het risico is ook de kans. Dus hoe kunnen we de vragen agenderen op een manier die de positieve kanten van deze ontwikkeling niet onnodig frustreert?

Reactieformulier

De met een * gemarkeerde velden zijn verplicht. U ziet eerst een voorbeeld en daarna kunt u uw bijdrage definitief plaatsen. Uw e-mailadres wordt niet op de site getoond. Reacties zonder achternaam worden verwijderd. Anoniem reageren alleen in uitzonderlijke gevallen in overleg met de redactie. U kunt bij de vormgeving van uw reactie gebruik maken van textile en er is beperkt gebruik van html mogelijk.