NAV beskytter privatlivets fred med sikre syntetiske data
Det norske Arbejds- og Velfærdsdirektorat
Gør test til en fest med syntetiske data, som beskytter borgernes sikkerhed. Det norske Arbejds- og Velfærdsdirektorat (herefter NAV) har det overordnede ansvar for arbejds- og velfærdsforvaltningen og forvalter i den forbindelse en tredjedel af statsbudgettet i Norge. NAV omfatter både kommunale og statslige ydelser.
Behovet
NAV har et stort behov for at teste sine IT-systemer - og helst ved hjælp af så få produktionsdata som muligt. NAV har længe arbejdet med at skabe gode syntetiske data, men det har indtil nu været gjort manuel.
NAV ønskede at populere sit TPS fagsystem (NAV’s version af folkeregisteret) med syntetiske data. De havde behov for at skabe data, som var statistisk repræsentative med produktionsdata, men samtidig umulige at henføre til fysiske personer. Det gør produktionsdata mere sikkert og virkelighedsnære.
For at kunne dække dette behov blev løsningen at oprette tre basisløsninger for syntetiske data i NAV
Mini-Norge Der er udviklet et Mini-Norge. En basispopulation, som er tilgængelig og “levende” i syntetiske miljøer. Machine Learning modellerne genererer syntetiske data til Mini-Norge med de samme egenskaber som data i produktion.
For at skabe Mini-Norge importerede man 100.000 personer i løsningen og fik derved skabt en statistisk repræsentativ befolkning. Alt dette er data, som er nødvendig for NAV i forhold til at kunne udbetale ydelser og behandle ansøgninger. Det er nødvendigt at ændre i systemerne hver dag via en orkestrator-komponent, så data forbliver repræsentative.
Mini-Norge er vokset, og løsningen er i dag oppe på 150.000 syntetiske personer.
Dolly er en selvbetjeningsløsning, som demokratiserer, hvordan NAV skaber syntetiske data. Løsningen sikrer, at alle kan oprette og skræddersy syntetiske data efter deres behov ved at lægge forskellige egenskaber ind.
Eksempelvis har “Foreldrepengeprojektet” i Norge haft brug for at teste, hvad der sker, når tvillinger er født i to forskellige år på hver sin side af nytårsaften.
Orkestrator-komponenten Dette er en applikation til styring af syntetiske data, der holder styr på de fiktive personer og deres tilknyttede personlige oplysninger, så der hele tiden kontrolleres, at deres “fødselsnummer” ikke er i brug og faktisk valideres som et korrekt “fødselsnummer”.
Orkestrator-komponentens opgave er at holde data om personerne i Mini-Norge levende ved f.eks at indarbejde, at personer bliver gift, der fødes nye personer, eller sygdom opstår.
Gevinsten for NAV
NAV har fået en hurtigere process, der nu betyder, at man kan generere op til 10.000 syntetiske personer på få minutter. Udover en besparelse i tid og ressourcer er data helt sikre og umulige at spore tilbage til fysiske personer. På den måde sikres det, at privatlivets fred for borgere bevares, og at man trygt kan teste på disse data.
Syntetiske data bruges ikke kun til systemudvikling og test, men også til oplæring og træning af sagsbehandlere i NAV.
NAV vandt prisen for indbygget persondata
Datatilsynet i Norge uddelte i foråret 2020 prisen for “Indbygget persondata i praksis”. Målet var at fremhæve gode eksempler på praktisk implementering af Privacy By Design. NAV vandt med bidraget "Gør test til en fest! Løsning og metode for syntetiske data" - en løsning og metode, som NAV har udviklet i samarbejde med twoday.
Vil du vide mere?
Bliv klogere på syntetiske data, og hvordan det afhjælper udfordringerne med persondata.