De digitale data kraan staat open!

Digitale data zijn nóóit veilig
Leestijd 4 minuten — Do 5 maart 2015
Huisje, boompje, beestje

"Technologie zorgt ervoor dat ons begrip voor burgerschap verandert". Met deze forse stelling begint dr. Mirko Schäfer (Nieuwe media & digitale cultuur, UU) zijn lezing in de reeks Huisje, Boompje, Beestje. Hij is expert op het gebied van digitale cultuur, social media en debatten omtrent de wisselwerking tussen technologie en maatschappij.

Persoon van het jaar

Wist je dat ook jij persoon van het jaar 2006 was, volgens Time Magazine? Het tijdschrift maakte 'jou' (maar ook mij!) persoon van het jaar in het artikel 'You control the information age'. Hiermee sprongen ze in op een grote verandering die de laatste jaren gaande is: passief publiek wordt interactief en gaat zelf content creëren. Alle miljoenen kleine bijdragen van jou, van mij en van alle anderen geven het grote publiek een stem door 'Big data'. Neelie Kroes noemt deze data de olie van het informatie tijdperk, maar of het ook écht goud is? Elke klik die wij op het internet maken wordt geregistreerd en bewaard. Alles wat wij dus online doen creëert data. Maar ook dingen die we niet direct aan internet linken: onze OV-kaart, aankopen in een winkel of een elektronisch patiënten dossier. Overheden, transportbedrijven en verzekeringen bezitten heel veel gegevens over ons. Medewerkers kunnen in potentie altijd bij onze gegevens als ze dat willen: 'Digitale data is nóóit veilig”, legt Schäfer uit.

Wat kan data allemaal?

Onze data laat zien wie bij wie hoort, wie er met wie wanneer en waarover communiceert, en op welke locatie mensen zich bevinden. Twitter en Facebook maken er een verdienmodel van, zij verkopen data. Dit geeft bedrijven de kans om inzicht te krijgen in het gedrag van hun doelgroep. Maar ook onderzoekers als Schäfer kunnen communicerende netwerken opvragen en naar correlaties zoeken. De Duitse politicus Malte Spitz toonde aan dat deze vrij beschikbare data ook nadelige gevolgen kan hebben. Hij vroeg zijn telefoongegevens van een half jaar op bij een Duits telecombedrijf. Deze data combineerde hij met zijn smsjes, tweets en andere online activiteiten. Hij toonde aan dat je zo kan monitoren waar iemand is en zelfs kan voorspellen waar iemand de volgende dag zal zijn. Daarmee leverde Spitz een krachtig argument dat de 'databewaarplicht van organisaties' gevaarlijk is voor de burgerlijke vrijheid. Overigens is deze bewaarplicht afgeschaft, maar in Nederland gebeurt het toch nog.

Controle

Data biedt controle, bijvoorbeeld aan de politie. Die screent duizenden digitale doodsbedreigingen per dag, maar niet elke bedreiging is even serieus. Vroeger moest je bewust een dreigbrief op de post doen en minimaal een dag later kwam deze aan bij de ontvanger. Dat is iets anders dan een boze tiener die in een opwelling via Twitter zegt zijn leraar iets aan te willen doen. Natuurlijk kan niet elke dreiging door een agent gechecked worden, eerst scant men met software grote hoeveelheden data. De computer moet dus het verschil tussen een bewuste bedreiging en een gepikeerde puber herkennen. Dat vergt zeer geavanceerde apparatuur.

Het opslaan en analyseren van data kan ook inzicht geven in wie welke online content schrijft. In geval van informatiebronnen als Wikipedia is dit heel belangrijk. Het kopje 'history' geeft bij elk artikel weer wie wanneer welke tekst heeft herschreven of verwijderd, aan de hand van IP-adressen. Zo zijn er regeringen die genocide of andere zaken proberen weg te moffelen. Deze IP-adressen kunnen worden geblokkeerd, zoals de computers van het Congres van de VS. Zij hebben te vaak geprobeerd artikelen rooskleuriger te maken dan de werkelijkheid. In dit artikel zie je welke 'edit wars' er gaande zijn. Zo is het meest aangepaste artikel in het Japans 'Koreans in Japan', in het Engels 'George Bush', maar in het Frans 'Ségolène Royal'. In Duitsland staat 'Croatia' bovenaan, maar 'homeopathie' ook in de top vijf.

Niet te kort door de bocht

We moeten ons niet vergissen in wat data ons precies vertelt. Studenten van Schäfer brachten data van Wikileaks, de organisatie die een poging doet geheime documenten publiek te maken, in kaart. Hij laat een figuur zien die weergeeft welke gevangenen in Guantánamo Bay met elkaar communiceren. Sommige hebben intensief contact, andere staan los van het geheel. Wat betekent dit? Zijn dit zogenaamde lone wolves, eenlingen in de criminaliteit? Na grondiger onderzoek van andere rapporten bleken dit (onschuldige) gevangen te zijn die ongevaarlijk zijn verklaard. Conclusies moet je nooit te snel trekken, ook niet uit (big) data. Een bijkomende valkuil is denken dat online data exact aangeeft wat in de maatschappij speelt. Lang niet iedereen is altijd online, laat staan dat alle gesprekken daar plaatsvinden. “De backyard talk wordt nooit digitaal”, vertelt Schäfer. Publieke opinie is alleen te meten onder mensen die online actief zijn, dat kan een bias in de resultaten geven.

Waarschuwing voor datalekken

De lezing sloot af met het onderzoek van Leanne Wijnsma van Setup, een Utrechtse culturele organisatie die kritisch nadenkt over nieuwe digitale cultuur. Zij doet onderzoek naar welke geur data zou moeten hebben. We hebben in Nederland gas een luchtje gegeven, waarom doen we dat bij data niet ook? Zo ruiken we onraad en kunnen we, net als bij een gaslek, op tijd de (data)kraan dichtdraaien. De grote vraag is natuurlijk of deze data moet stinken of lekker moet ruiken. Is big data inderdaad de olie, het zwarte goud van dit tijdperk, die ons welvaart brengt of moeten we vrezen voor de dikke laag stinkende smurrie die ons in de weg zit? De toekomst zal het uitwijzen.

Kijk hier de lezing van Mirko Schäfer terug. Volgende week vertelt dr. Egon van den Broek (Informatica, UU) over het Internet of Things. Dat is nu nog een hype, maar langzamerhand gaat het om meer dan alleen gadgets. Bedrijven en wetenschappers onderzoeken hoe ze de sensoren, die van alles registreren en met elkaar in contact staan, nuttig en veilig kunnen inzetten. Hoe zorg je dat het ook maatschappelijke waarde krijgt?