Skip to content

Master Data Management: Kvalitetsmåling og overblik

Dette er det tredje ud af seks blogindlæg i vores serie om Master Data Management. Denne gang kan du blive klogere på kvalitetsmåling og overblik.
Jun 22, 2021 12:00:00 AM twoday Data & AI

En af kerneopgaverne i Master Data Management er at have styr på sine data i den rette kvalitet. Datakvalitet kan måles på mange forskellige måder.

Mange virksomheder har over tid været igennem adskillige IT-implementeringer og i takt med, at der er kommet flere og flere systemer til, har de mistet overblikket over, hvor og hvordan data ligger i de forskellige systemer. Det betyder, at de i dag kæmper med dårlig datakvalitet og har ikke de rette værktøjer til at skabe overblik – eller så mangler de rette personer i organisation til løbende at bekæmpe den dårlige data.

Det er en voksende bekymring for de fleste virksomheders datateam, fordi kvalitet er nøglen til at opbygge tillid til de data og analyser, der stilles til rådighed for forretningen.

Sikring af datakvalitet er en løbende indsats og kræver, at de med ansvar får adgang til KPI-er og overblik, der hjælper med at forebygge og vedligeholde data. Datakvalitet kan måles på mange måder; her er nogle af de mest anvendte:

  • Nøjagtighed
    Nøjagtighedsscoren fortæller noget om dataindhold, og der bygges ofte regler op, som sikrer navnestandarder, formater mv. Et eksempel på en regel er: ”Personnavne må kun indeholde bogstaver og må gerne have enkelte special tegn.”
  • Fuldstændighed
    Fuldstændighedsscoren viser, hvor der evt. mangler oplysninger i data. Nogle stamoplysninger er essentielle for, at virksomhedens interne processer fungerer, hvorfor det for disse er en god idé at få opsat regler og måle på, hvor data mangler. Eksempel på en regel er: ”Personadresser skal indeholde vejnavn, vejnummer, postnummer, by, land og må ikke være blanke eller have NULL værdier”.
  • Ensartethed
    Ensartethedsscoren måler på, om der er sammenhæng i data. Disse sammenhænge er også med til at sikre højere fuldstændighed, hvis reglerne opsættes i relation til hinanden. Et eksempel på en regel er: ”Når der oprettes en personadresse og postnummer er udfyldt, SKAL by og land også være udfyldt”.
  • Integritet
    Integritetsscoren måler på troværdigheden, og konsistens i data i hele dets livscyklus og har til hensigt at belyse utilsigtede ændringer mv. Et eksempel på en regel er: ” Personoplysninger skal på et hvert tidspunkt være ens i HR-system og lønsystem”.
  • Aktualitet
    Aktualitetsscoren måler på tilgængelighed i data. Tilgængelighed bestemmes ofte ud fra beslutningstagernes behov og er med til at sikre rette information i rette tid. Et eksempel på en regel er: ”En persons ferieboligadresse skal oprettes på samme tid med privatadresse, og eventuelle ændringer skal være opdateret indenfor samme arbejdsdag, som ændringen er modtaget”.

Udover de datafokuserede kvalitetsmålinger, er det også vigtigt at have fokus på operationelle målinger – såsom måling af nyoprettelser, antal korrektioner, antal dubletter og dataejers evne til at rydde op og rense ud i dårlige data. Det er disse KPI’er, som også er med til at give indsigt i fremdriften for forbedring af datakvaliteten. Bliver vi som organisation bedre eller dårligere over tid? Er der bestemte perioder i året, som er mere udfordrende end andre?

Data henfalder med en hastighed på 70% om året

(Kilde: Biznology)

Medarbejdere spilder 50% af deres tid på jagt efter data, korrigerer fejl og besvarer spørgsmål om kilden til usikkerhed i data

(Kilde: Harvard Business Review)

$9,7 mio. er hvad data af dårlig kvalitet i gennemsnit koster virksomheder om året

(Kilde: Gartner)

 

Hvad er de typiske udfordringer?

Dårlige data kan have betydelige forretningsmæssige konsekvenser for en virksomhed. Data af dårlig kvalitet er ofte kilden til operationelle problemer, unøjagtige analyser og ufuldstændige forretningsstrategier.

Eksempler på den økonomiske skade, som datakvalitetsproblemer kan forårsage, omfatter ekstra udgifter når produkter sendes til forkerte kundeadresser, mistede salgsmuligheder på grund af fejlagtige eller ufuldstændige kundeoplysning og bøder for ukorrekt indrapportering af økonomiske eller lovgivningsmæssige informationer.

Her er et par afledte eksempler fra hverdagen:

  • En virksomhed har forkert leveringsadresse på ordren. Det betyder, at varerne sendes et forkert sted hen, modtageren enten beholder varen eller afviser den – hvilket resulterer i ekstra forsendelsesomkostninger, spildt arbejdstid på håndtering af kundehenvendelser og behandling af returordre mv.
  • En virksomhed har forkerte styklister eller varebeskrivelser. Det betyder, der bestilles forkerte varer til butikken, eller at der mangler varer på lagret, hvilket resulterer i manglende målrettet salg i butikken samt forsinkelser, fejl og mangler i produktionen.
  • En virksomhed har forkerte bankoplysninger på medarbejderne. Det betyder, at lønudbetalingen til medarbejderne afvises eller udbetales til forkert modtager, hvilket resulterer i ekstra tid og penge til inddrivelse og genudbetaling.
  • En virksomhed har oprettet den samme kunde flere gange med forskellige eller næsten ensartet oplysninger på navn, adresser og telefonnumre for hvert kundenummer. Det betyder, at kunden slet ikke bliver kontaktet, hvilket resulterer i tabt salgspotentiale, eller at den samme kunde kontaktes flere gange (kan være telefonisk eller pr. brev.), hvilket ender ud i en dårlig kundeoplevelse og kan på sigt gøre, at kunder mister tålmodigheden, og virksomheden mister kunden.

Data Quality Management Framework – Organisationen er nøglen til vedvarende succes

For at sikre kontinuerligt fokus og skabe forretningsværdi er det vigtigt, at arbejdet med forbedring af datakvalitet ikke stopper ved ”det første MDM-projekt”. Det kræver vedvarende fokus fra både ledelsen og medarbejderne i hverdagen. Til det formål anbefaler vi, at der opbygges et Data Quality Management Framework, og det behøver ikke være en tung, kompliceret proces; det kan gøres ret simpelt, og her er nogle af vores anbefalinger:

En simpel 4-trins proces

Trin 1 – Målbillede og målsætninger

Få lavet et overblik over, hvor I gerne vil bevæge jer hen (målbillede), så I har noget at styre efter og få udpeget ejerskab.

Spørg jer selv:

  • Hvilke datakvalitetsmetrikker vil vi gerne måle på?
  • Hvad er målsætning for hvert målepunkt?
  • Vægter nogle målepunkter højere end andre?
  • Skal der tages højde for specifik forretningslogik?
  • Hvad er reglerne for hvert målepunkt?
  • Hvem er interessenter for målepunktet i organisationen?
  • Hvem er dataejer?
  • Har dataejer en Data Steward der hjælper til i dagligdagen?
  • Hvilke kritiske forretningsprocesser er påvirket af målepunktet?

Trin 2 – Vurdering as-is.

Få indblik i hvor I er henne nu, så I ved hvor langt, I er fra målbilledet og konkret kan arbejde med målsætninger. I dette trin brydes hvert dataobjekt, I arbejder med, ned i specifikke attributter, så I ved, hvordan hvert enkelt påvirker det overordnede målsætning. As-is er desuden jeres baseline for sporingen over tid og opfølgning på fremdriften.

Trin 3 – Fit/Gab-analyse

Fit/Gab-analysen giver jer indblik i, hvor og hvordan I kan forbedre de enkelte målepunkter. Det er her vigtigt at have forståelse for forretningens behov samt forstå, hvilke forretningsprocesser der er påvirket af de data, der indgår i målepunktet. Husk på ikke alle har brug for sammen grad af f.eks. nøjagtighed. I kan sagtens have interessenter, som kan leve med, at kundernes adresser ikke er 100% korrekt, så længe der er korrekte nok til, at leverandører kan finde frem til adressen – hvorimod andre interessenter har behov for at adressen er korrekt for at kunne udføre en bestemt udgravning eller lign. I de fleste tilfælde er behovet ret ens i forretningen, men pointen her er, at det er vigtigt at forstå eventuelle forskelle.

Det gør sig også gældende for alle målepunkter, og et andet eksempel er forskellige behov for fuldstændighed i data. Nogle interessenter har brug for værdier i alle stamdata omkring f.eks. kunder (kredit- og økonomiafdelingen), hvorimod andre til deres forretningsproces måske kun har brug for det væsentligste såsom navn, adresse, telefon og e-mail på kunderne. Vi anbefaler at få klassificeret jeres data ud fra kritikalitet og så starte med at fokusere på de mest kritiske først, da alt ikke kan eller nødvendigvis skal løses på én gang.

Trin 4 – implementering

Når I kender jeres mangler i forhold til målbilledet, er det tid til at få opbygget nogle gode regler omkring hver kvalitetsmåling. Reglerne skal dels være med til at konkretisere, hvad der helt specifikt skal måles på (se nogle af eksemplerne fra forrige afsnit) og dels være grundlag for jeres handlinger omkring data. Det bedste udbytte får I, hvis jeres tekniske løsning understøtter opsætning af reglerne, således at I har så lidt manuelt arbejdet som muligt. Der findes en del offentligt tilgængelige standarder, som kan anvendes og integreres i jeres interne systemer. Disse data kan både bruges til normalisering og berigelse. (se mere om berigelse af data i blogindlæg Golden Record).

Derudover er det vigtigt at få opsat relevant rapportering til måling og overblik, som også er med til at sikre, at I hele tiden kan følge med i, hvor der skal arbejdes med forbedringstiltag samt bruges til kontrol/effektmåling af tiltag.

Den organisatoriske implementering består i at få jeres dataejere til at tage ansvar og delegeret det lavpraktiske dagligdags arbejde ud til en eller flere Data Stewards. Jeres organisering, roller og ansvar er essentielle for at kunne lykkes med vedvarende fokus og kvalitetssikring af data. Dette er et emne for sig, som vi kommer mere ind på i et af denne blogpost-series næste udgivelser.

Hvordan kan kvalitetsrapportering hjælpe?

Til at understøtte jeres data quality framework har I brug for en rapportering, der giver indsigt i eventuelle kvalitetsproblemer.

Rapporteringen kan med fordel sættes op til at spore de enkelte dataopdateringer og genberegne relaterede kvalitetsmålinger (KPI’er) samt opstilles med en trend over tid, så I hele tiden har et opdateret billede af, hvad status pt. er, og hvor I bevæger jer hen.

Rapporteringen kan tjene flere formål, og målingen af datakvalitet kan betragtes på forskellige måder:

Dataplatform

  • Sikrer datatestning og validering gennem hele ETL-flowet
  • Sikrer logning og fejlhåndtering
  • Validering af datasæt, sammenligning af f.eks. kube-DAX-resultatsæt med masterdatasæt

Bidrager blandt andet til kvalitetsmålinger som; fuldstændighed, pålidelighed, aktualitet og tilgængelighed.

Dataobjekt (En entitet)

  • Måler datakvalitet pr. dataobjekt
  • Validering af datasæt, sammenligning af fx attributter på tværs af systemer og datasæt
  • Sikrer et golden record fokus

Understøtter blandt andet kvalitetsmålinger som; unikhed, fuldstændighed, gyldighed/integritet, nøjagtighed og konsistens.

Forbrug og ydeevne

  • Sikrer overvågning af responstid og performance på forespørgsler, rapporter mm.
  • Sikrer fejlhåndtering af pipelines, ETL-jobs osv.
  • Sporer brugsmønster

Bidrager blandt andet til kvalitetsmålinger som: Pålidelighed, aktualitet, tilgængelighed og Data Stewardship/ansvarlighed.

Uanset formål er det vigtigt, at jeres rapportering kan visualisere status på flere niveauer (aggregeret, summeret, detaljeret) og støtter jer i at svare på forretningsspecifikke spørgsmål omkring dårlig data og deres effekt på arbejdsprocesser og forretningen. 

Hvis du er interesseret i at blive klogere på, hvordan du sikrer, at data lever op til den forventede kvalitet – og visualiserer den i Power BI - kan du tage med på vores kursus i håndtering af datakvalitet.

 

Relaterede artikler