Syntetiske testdata - skab projekter ud fra værdifulde grundlag
Data gør os klogere og kan bruges som et solidt grundlag til udvikling af nye applikationer. Men ofte står mange virksomheder med datasæt, der ikke er valide, og derfor ikke formår at give den ønskede indsigt.
Syntetiske data forbedrer data og sikrer en GDPR-sikker proces ved at efterligne og anonymisere faktiske data.
Drømmer I om værdifulde data?
Syntetiske data er genereret af en Machine Learning model ud fra produktionsdata. De syntetiske data opfører sig som de originale data, men uden mulighed for at identificere personlig information. Det skyldes, at der er tale om kunstigt konstruerede data og ikke bare anonymiserede data. Data, som tidligere var underlagt streng adgangskontrol, kan nu gøres tilgængelig uden at det udgører en sikkerhedsrisiko.
Overvejelser om, hvorvidt I skal overgå til Cloud med jeres udviklings- og testmiljøer, kan også blive nemmere med kendskab til, hvordan syntetiske data sikrer personfølsomme informationer.
GDPR Compliance
Syntetiske data er genereret af en Machine Learning model, og sikrer jer derfor, at data ikke kan henføres til fysiske personer.
Tilgængeliggør data
Syntetiske data er genereret af en Machine Learning model, og sikrer jer derfor, at data ikke kan henføres til fysiske personer.
Øget datakvalitet
Syntetiske data giver jer et bedre datagrundlag i forhold til, hvad I får med rene produktionsdata.
Bedre sikkerhed
Syntetiske data sikrer jer, at data ikke er personhenførbare og kan anvendes uden risiko.
Sådan arbejder vi med syntetiske data
1. Kortlægning
Vi kortlægger jeres systemer og vurderer jeres behov for syntetisering.
2. Anonymisering
Vi fjerner alle identificerbare felter og sjældne tilfælde, som kan være genkendelige og lette at henføre til en fysisk person.
3. Syntetisering
Personer i de anonymisede data kan stadig identificeres, derfor træner vi en Machine Learning model til at genere kunstige data baseret på anonymiserede data.
4. Tilgængelighed
De syntetiske data gøres nu tilgængelige i de systemer, hvor de skal bruges.
5. Opdatering
Produktionsdata ændrer sig løbende, hvorved de statiske data forældes. De syntetiske data opdateres derfor dagligt i en automatiseret proces.
Få et solidt datagrundlag
Det kan være nemt at få fat på data, der kan give os indsigt i, hvordan vi skal udvikle applikationer - men ofte kan datasæt give to udfordringer:
1. Data er langt fra valide
2. Processen er ikke GDPR-sikker
Udfordringer som kan løses med hjælp fra syntetiske data. Hvad det går ud på, hvordan og hvornår det kan give værdi, kan du blive klogere på i dette whitepaper.
NAV beskytter privatlivet med sikre syntetiske data
Det norske Arbejds- og Velfærdsdirektorat (NAV) har det overordnede ansvar for arbejds- og velfærdsforvaltningen og forvalter i den forbindelse en tredjedel af statsbudgettet i Norge. NAV omfatter både kommunale og statslige ydelser.