Data Subsetten

Wie snel en doeltreffend software wil testen heeft een behapbare datatest nodig. De complete database is vaak niet geschikt vanwege de grootte en complexiteit. Handmatig een stukje eruit halen werkt niet, want dat neemt de representativiteit van de gegevens weg. In zo’n geval is data subsetten de oplossing.

Wat is data subsetten?

Bij het maken van een datasubset wordt door middel van een geautomatiseerde tool een representatieve selectie gemaakt van de productiedata.

Daarmee ontstaat een testset die beheersbaar is, in tegenstelling tot de grote en complexe totale dataset.

Bij het maken van een datasubset blijven de verbanden tussen gegevens (de referentiële integriteit) in stand: als in een veld wordt verwezen naar een veld in een andere tabel, blijft deze verwijzing in stand. Daarmee ontstaat een representatieve testset die geen onnodige fouten zal genereren door verkeerde verwijzingen. Ook datatypen blijven gelijk: een numeriek veld blijft numeriek.

Voordelen van data subsetten

  • Testen gaat sneller, omdat minder tijd nodig is voor opslag en het doorlopen van de test.
  • Een volledige database slurpt bandbreedte, een subset niet. Er is minder storage nodig, minder hardware en minder licenties.
  • De subset is representatief voor de totale database doordat verwijzingen maar ook datatypen (zoals numerieke velden) ongewijzigd blijven.
  • Je kunt de testdata gemakkelijker en sneller verversen en toepassen voor verschillende testers en testdoeleinden.
  • Je voldoet aan het proportionaliteitsprincipe van de Europese privacywetgeving: de omvang van de testset is afgestemd op de aard en het doel van de test.

Product specificaties data subsetten

Algemene eigenschappen

  • Eenvoudig te implementeren
  • Snel uit te rollen
  • Lage operationele kosten
  • Versnelt de development cyclus
  • Sluit aan bij agile werken
  • Besparing voor dataopslag

Functionele eigenschappen

  • Behoud van referentiële integriteit dataset
  • Datakwaliteit blijft ongewijzigd
  • Uit te breiden met synthetische data
  • Subset vrij definieerbaar

Technische eigenschappen

  • Eenvoudig schaalbaar
  • Hoge performance
  • Cross platform
  • Minimale beheersinspanning
  • Eenvoudige integratie met CI

Onze oplossing

Onze oplossing voor geautomatiseerd subsetten is gebruiksvriendelijk en relatief snel te implementeren. In combinatie met de module Datamasking biedt de module voor Subsetting een oplossing voor iedereen die snel een representatieve dataset nodig heeft. De module is toepasbaar op verschillende databases zoals Oracle, Microsoft SQL server en IBM DB2.

Wil je meer informatie ontvangen? Neem dan contact met ons op!

Laatste nieuws

april 26, 2024

Minimaliseren van archiveringskosten: een slimme investering in kostenbesparing

In de moderne zakenwereld is efficiëntie niet alleen een wens, maar een…

Lees meer
april 25, 2024

AVG-boetes en handhaving: Wat je moet weten?

De handhaving van de Algemene Verordening Gegevensbescherming (AVG) heeft…

Lees meer
april 24, 2024

Dunavie: Communicatie de sleutel om informatiebeveiliging en AVG continu onder de aandacht te houden

Het goed beschermen van persoonsgegevens en borgen van privacy wordt voor…

Lees meer