AVG
Woo
Documenten anonimiseren: waarom een zwart balkje niet genoeg is
Veel organisaties denken dat ze documenten anonimiseren door een zwart vlak over persoonsgegevens te plakken. De Autoriteit Persoonsgegevens waarschuwt dat dit niet werkt: de onderliggende tekst blijft gewoon leesbaar. Bovendien kan wie weet hoe te zoeken, die gegevens zo terughalen — en dat leidt rechtstreeks tot een meldingsplichtig datalek.
Bij het anonimiseren van documenten gaat het niet om het verbergen van persoonsgegevens, maar om het permanent verwijderen ervan. Toch zien we keer op keer dat organisaties — van gemeenten tot zorginstellingen — kiezen voor een techniek die niet werkt: een zwarte rechthoek over de tekst. Kopieer je die tekst daarna, dan staat de naam, het adres of het BSN-nummer gewoon in kladblok.
De Autoriteit Persoonsgegevens (AP) publiceerde hier onlangs een uitgebreide waarschuwing over. Dit is geen abstracte oproep, maar een reactie op een patroon dat ze structureel zien: organisaties die te goeder trouw documenten publiceren op basis van de Wet open overheid (Woo), terwijl de persoonsgegevens er technisch gezien nog gewoon in zitten.
Wat gaat er mis bij het lakken van documenten?
Het begrip ‘lakken’ is afkomstig uit de papieren wereld: een zwarte stift over vertrouwelijke tekst. In digitale documenten werkt dat principe echter niet. Desondanks wordt het nog steeds zo toegepast. De AP noemt dit expliciet als een verkeerde techniek:
“Informatie in elektronische documenten bedekken met zwarte rechthoeken en de tekst eronder laten staan” — dit is een techniek die niet werkt voor het anonimiseren van persoonsgegevens. De ontvanger kan de gegevens terughalen door de tekst te kopiëren en te plakken.
Het probleem speelt bij vrijwel elk documenttype. De AP wijst op een reeks kwetsbaarheden:
Bedekte tekst in PDF en Word
Een zwart vlak over tekst verwijdert namelijk niets: de tekst blijft selecteerbaar, kopieerbaar en zelfs vindbaar via zoekmachines.
Verborgen metadata
Auteursnaam, bewerkingsgeschiedenis en track changes bevatten persoonsgegevens die niet opvallen bij publicatie.
Verborgen rijen in spreadsheets
Verborgen kolommen en werkbladen zijn met twee klikken zichtbaar. ‘Verborgen’ persoonsgegevens zijn dat technisch niet.
Ingesloten objecten en afbeeldingen
Grafieken en afbeeldingen kunnen brondata bevatten met GPS-coördinaten, apparaatgegevens of gekoppelde bestanden.
Wat betekent correct documenten anonimiseren volgens de AVG?
De AVG en de Wet open overheid (Woo) stellen duidelijke eisen: persoonsgegevens mogen niet vindbaar zijn in gepubliceerde of gedeelde documenten. Dat betekent daarom dat gegevens daadwerkelijk uit het document moeten worden verwijderd — niet bedekt, niet verborgen, maar definitief weg.
Concreet houdt correct anonimiseren in dat:
Handmatig voldoen aan al deze eisen is bovendien tijdrovend en foutgevoelig. Zeker bij grote hoeveelheden documenten of complete dossiers — zoals bij Woo-verzoeken — is de kans op menselijke fouten realistisch en zijn de gevolgen groot.
FileFactory van EntrD: persoonsgegevens echt verwijderen
De FileFactory van EntrD is ontwikkeld om precies dit probleem op te lossen. In plaats van persoonsgegevens te bedekken, worden ze daadwerkelijk uit het document verwijderd en vervangen door een zwart balkje. Kortom: wat je ziet in het geanonimiseerde document, is ook wat er technisch in staat — niets meer.
Datalek beperken, niet alleen voorkomen
FileFactory voorkomt geen datalekken, en dat is een eerlijke nuance. Geen enkele tool kan immers garanderen dat er nooit een incident plaatsvindt. Wat FileFactory wél doet, is de impact van een datalek drastisch beperken. Als een document onbedoeld openbaar wordt, zijn de persoonsgegevens er simpelweg niet meer in — er valt immers niets te lekken dat er niet meer is.
Dit is namelijk fundamenteel anders dan een document publiceren met persoonsgegevens die ‘verstopt’ zijn achter een zwart vlak. In dat geval is er bij publicatie immers al sprake van een datalek — ook als niemand er direct naar zoekt.
Wat levert correct documenten anonimiseren met FileFactory op?
Veelgestelde vragen over documenten anonimiseren
Wat is het verschil tussen lakken en anonimiseren?
Lakken is een term uit de papieren wereld: een stift over tekst. In digitale documenten betekent correct anonimiseren dat persoonsgegevens permanent worden verwijderd. Bedekken met een zwart vlak is daarom geen anonimisering — de tekst blijft immers technisch aanwezig.
Geldt de verplichting om te anonimiseren voor alle organisaties?
Ja. De AVG verplicht alle organisaties die persoonsgegevens verwerken om deze te beschermen. Voor overheden geldt bovendien de Woo, die actieve openbaarmaking verplicht stelt — maar altijd met correcte anonimisering van persoonsgegevens.
Wat is een datalek bij gepubliceerde documenten?
Als een gepubliceerd document persoonsgegevens bevat — ook al zijn ze bedekt met een zwart vlak — is er al sprake van een (potentieel meldingsplichtig) datalek. Dit geldt zelfs als niemand actief naar de gegevens heeft gezocht.
Hoe werkt FileFactory bij grote hoeveelheden documenten?
FileFactory verwerkt documenten en complete dossiers automatisch, waarbij persoonsgegevens worden gedetecteerd en permanent verwijderd. Hierdoor is het ook bij grote Woo-dossiers schaalbaar en betrouwbaar.
Wil je dus zien hoe FileFactory van EntrD documenten anonimiseren in de praktijk werkt? Vraag een demo aan of neem direct contact op.
