In deze IT community column gaat Willem Sloet tot Everlo dieper in op de ethiek rondom het verzamelen van data. Wat zijn bijvoorbeeld de problemen die in het vak zich voordoen en welke verantwoordelijkheid de data professional moet nemen om op een ethische manier met de data van anderen om te gaan.
Waarom willen mensen zoveel gegevens verzamelen?
In mijn vorige column heb ik het gehad over wat data ethiek is en hoe je als data professional verandering kan brengen door jezelf te blijven. Daarin roep ik data professionals op om eerder aan de bel te trekken als het gaat om dubieuze praktijken rondom het gebruik van gegevens en informatie. In dit stuk licht ik het vraagstuk uit over de drang en gemak van het verzamelen van gegevens. Ik kijk naar de mogelijke oorzaken die aan de verzameldrang ten grondslag liggen, waarna ik laat zien hoe dit soms buitenproportioneel kan uitpakken. Ik relateer het daarna weer terug aan wat ik zei in de vorige column over ‘het grote plaatje kunnen’ zien en na het lezen hiervan vraag je je vaker af hoe jouw werk past binnen het datalandschap en de maatschappij in het algemeen.
Het belang van gegevensverzameling in het begrijpen van de wereld
Waarom willen mensen zoveel gegevens verzamelen? Mensen begrijpen hun wereld door middel van categoriseren van hun omgeving en dit maakt het mogelijk om het vraagstuk wat je hebt te analyseren. Dit doet iedereen bewust en onbewust de hele dag, continu. Vanaf dat je opstaat en je de gordijnen open doet ("Wat voor weer is het vandaag?”), tot aan dat je naar bed gaat ("Wat voor dag was het vandaag?”). Je krijgt prikkels binnen en dit leg je tegen wat je kent in je geheugen en maakt een oordeel (veel grijze wolken: waarschijnlijk geen mooi weer; productief geweest vandaag, dus het was een goede dag). Als data professional doe je dit ook. Je krijgt vraagstukken binnen en je gaat zoeken in het geheugen van de organisatie om een oordeel te vormen. Het devies is dan ook: meer gegevens betekent sterkere oordelen, want de statistiek krijgt dan meer kracht. Het verzamelen van gegevens op zichzelf is helemaal niet slecht, maar of het proportioneel is voor het doel staat natuurlijk ter discussie.
Om te laten zien wat ik bedoel, haal ik graag een voorbeeld aan van de belastingdienst. De belastingdienst heeft onder andere de volgende taken:
- het heffen en innen van rijksbelastingen en premies volksverzekeringen;
- het opsporen van belastingfraude (door de FIOD, de opsporingsdienst van de Belastingdienst).
Hierom wil de belastingdienst gegevens verzamelen die leiden tot een gegrond oordeel over belastingfraude en daarmee kan het haar eerste taak, het innen van belasting, goed uitvoeren. In deze hoedanigheid is de belastingdienst in 2012 begonnen met het opvragen van parkeergegevens zodat de dienst beter kon controleren of de gereden kilometers van zakelijke leaserijders eerlijk zijn doorgegeven, omdat je als zakelijke leaserijder beperkt privé kilometers mag rijden als je geen bijtelling betaald. De gegevens zijn opgevraagd bij drie bedrijven waarmee via de telefoon betaald kan worden voor een parkeerplek. Veel mensen wisten niet af van het opvragen van deze gegevens en dit is niet van tevoren aangekondigd door de belastingdienst. Deze actie was daarom controversieel en uiteindelijk is er een rechter aan te pas gekomen. In eerste instantie was de uitspraak dat deze gegevens geheim moeten blijven, maar in hoger beroep werd bepaald dat dit legaal was. Het is overigens belangrijk om te beseffen dat de Algemene Verordening Gegevensbescherming (AVG) wetgeving nog niet van kracht was, maar het is opvallend dat twee rechters verschillende uitspraken hebben gedaan. Blijkbaar lag dit geval op de grens van legaliteit en dat heeft voor een deel te maken met de proportionaliteit.
Het proportionaliteitsbeginsel en privacy-inbreuk
Het proportionaliteitsbeginsel gaat over of de privacy-inbreuk die wordt gemaakt bij het verzamelen van gegevens in proportie staat tot het doel ervan. Waarom dit op spanning staat bij dit voorbeeld, is omdat er gegevens werden opgevraagd van alle gebruikers van drie parkeerdiensten, om leaserijders te controleren. Echter, als ik geen leaserijder ben, kan ik op dit gebied niet frauderen, naar mijn mening is het dan niet proportioneel om mijn parkeergegevens op te vragen. Dit is een reden waarom in de AVG het proportionaliteitsbeginsel is opgenomen, zodat het makkelijker is om hierover uitspraken te doen. Naast de proportionaliteit staat er nog iets anders onder spanning, wat niet door de AVG is afgevangen. Naar mijn mening lijkt het principe ‘onschuldig tot het tegendeel bewezen is’ om te draaien. Door actief te zoeken naar fraudeurs draait het principe om naar ‘gezien worden als fraudeur tenzij ik kan laten zien dat ik me aan de regels houd’. Het omdraaien van dat principe kan voor onveilige situaties zorgen voor de burger, zoals onterechte boetes.
Ik geloof niet dat de belastingdienst die gegevens heeft opgevraagd uit kwade wil, maar dat het vanuit hun eigen bubbel als een goed idee werd gezien. Vanuit zo’n bubbel ontstaan ideeën die voor de rest van de maatschappij kunnen worden gezien als onwenselijk. Deze ideeën lijken te ontstaan volgens eenzelfde proces als bij de echo chambers in mijn vorige column. Vraag jezelf daarom regelmatig af hoe jouw acties met gegevens overkomen bij iemand anders, want ook al zijn jouw intenties goed, een ander kan deze intenties niet zien vanaf de zijlijn. Check je aannames door het met een ander erover te hebben. Vanuit jouw bubbel kunnen sommige ideeën logisch en noodzakelijk lijken, maar voor mensen buiten die bubbel hoeft dat niet zo te zijn. Op die manier plaats je jouw werk in het ‘grote plaatje’. De belastingdienst heeft in ieder geval in 2015 aangegeven dat ze is gestopt met het opvragen van de parkeergegevens en dat de gegevens zijn verwijderd. Naar eigen zeggen ging dit middel ook voor de directeur van de belastingdienst te ver.
Ook de volgende stap zetten in data?Meld je aan voor ons IT traineeship