Datageneratie

Heb je snel een grote hoeveelheid synthetische testdata nodig? Bijvoorbeeld voor een performance test? Wij kunnen op afroep een set testdata voor je genereren in elk gewenst volume. Het enige wat we nodig hebben is een voorbeeldrecord.

Bekijk de DataFactory

Meer informatie aanvragen

Wat is datageneratie?

Het genereren van synthetische data is iets anders dan het anonimiseren of pseudonimiseren van data. Datageneratie houdt in dat nieuwe, fictieve testgegevens worden aangemaakt. Die fictieve gegevens moeten in alle opzichten voldoen aan de eisen die je eraan stelt, zoals veldlengte, soort en onderlinge relaties.

Waarom kiezen voor synthetische data?

Soms is het wenselijk om (grote hoeveelheden) synthetische testdata te hebben. Voor een performancetest bijvoorbeeld. Daar is een grote verscheidenheid aan verschillende testgevallen voor nodig. Of denk aan een nieuw product, waarbij testgevallen nodig zijn die nog niet voorkomen in de productieomgeving. In die situaties moet je testdata genereren.

Onze oplossing? De DataFactory

EntrD heeft een oplossing ontwikkeld waarmee wij op afroepbasis kunnen voorzien van een gegenereerde dataset. Deze dataset wordt specifiek voor je samengesteld en voldoet zowel qua lay-out als qua inhoud volledig aan de wensen. Op basis van een door jou aangeleverd voorbeeldrecord kunnen wij elk volume aan data voor je genereren. Dit kan snel: in de regel kost het niet meer dan een paar dagen. Je ontvangt de gegenereerde testset elektronisch en kunt hem direct gebruiken in willekeurig welke testomgeving.

Wil je meer informatie ontvangen? Neem dan contact met ons op!

Bekijk de DataFactory

Meer informatie aanvragen

Product specificaties DataFactory

Algemene eigenschappen

Eenvoudig te implementeren
Snel uit te rollen (gemiddeld 2 tot 6 weken)
Lage operationele kosten
Geanonimiseerde gegevens zijn onherleidbaar (in lijn met eisen vanuit de Wbp en de GDPR)
Versnelt de development cyclus
Sluit aan bij agile werken
Voorkomt de noodzaak van aanhouden van risicokapitaal (zie ook business case)
Voorkomt de impact van datalekken (boetes en reputatieschade)
Geanonimiseerde gegevens zijn breed inzetbaar (Test, Analyse, Opleiding, Demo, Ondersteuning, Outsourcing etc.)

Functionele eigenschappen

Consistent anonimiseren over tijd zonder gebruikmaking van een ‘vertaaltabel’
Consistent anonimiseren van een gehele keten
Behoud van relevante relaties (indien gewenst)
Geografische spreiding van relaties blijft intact (indien gewenst)
Leeftijden blijven ongewijzigd (indien gewenst)
Gegenereerde gegevens voldoen aan data specifieke regels (bijvoorbeeld de 11-proef)
Datakwaliteit blijft ongewijzigd
Geanonimiseerde data is eenvoudig te onderscheiden van productiegegevens

Technische eigenschappen

Volledig database onafhankelijk
Eenvoudig schaalbaar
Hoge performance
Cross platform
Minimale beheersinspanning
Eenvoudige integratie met CI
Ondersteunt grote datasets
Anonimiseren gebeurt volledig in-memory
Mogelijkheid om eigen maskeerregels toe te voegen
Standaard voorzien van ruim 10 mogelijkheden om gegevens te anonimiseren

Laatste nieuws

Blog

3 juli 2025

Snellere complianceprocessen met automatische documentcontrole

In een tijdperk waarin regelgeving steeds strenger wordt, is naleving van die…

Lees meer

Blog

26 juni 2025

EntrD & het Normenkader IBP

Krijg grip op gegevens: EntrD onderwijsinstellingen veilig vooruit Wat is het…

Lees meer

Blog

17 juni 2025

EntrD en iprox.open bundelen hun krachten

De samenwerking tussen iprox en EntrD werpt zijn eerste vruchten af. De…

Lees meer