Data is overal om ons heen.
Het genereren van data neemt een steeds grotere vlucht door de beschikbare techniek, waarmee het mogelijk is om steeds meer inzichten te krijgen en daar onze dienstverlening op aanpassen. Maar het vergaren en koppelen van data en het verkrijgen van inzichten is een lastige en tijdrovende taak, omdat de kwaliteit van de data vaak te wensen over laat. Daar waar een goede datakwaliteit een enabler kan zijn voor innovatie en procesverbetering, kan een ontoereikende datakwaliteit een ernstige belemmering zijn of zelfs bron zijn van juridische conflicten.
 
Van een gedigitaliseerde organisatie mag worden verwacht dat de kwaliteit van data is geborgd door:
  • het eigenaarschap en de verantwoordelijkheid voor data is expliciet belegd en de eindverantwoordelijke leiding van een organisatie erkent het belang van datakwaliteit;
  • een organisatie borgt de datakwaliteit door datakwaliteitseisen, data-definities, data-govenance, datastromen en de relatie tot de informatiebehoefte in kaart te brengen; en
  • er zijn duidelijke afspraken over de wijze waarop datakwaliteit wordt gemonitord en beheerd. 
De bij NOREA geregistreerde IT-auditors zijn onafhankelijk opererende IT-deskundigen die bij organisaties de juiste opzet, inrichting en werking van de processen rond datakwaliteit beoordelen. 

Van een organisatie mag worden verwacht dat zij datakwaliteitsmanagement heeft geborgd, op drie niveaus:


01

Organisatiegerichte datakwaliteitsbeheer

 

Een organisatie wil haar doelstellingen bereiken. Tegelijkertijd wil zij haar risico’s beheersen, waaronder die tegen verkeerde beslissingen of aangiftes op basis van foutieve data. Als je data ziet als belangrijk bedrijfsmiddel dan brengt dat de nodige implicaties met zich mee. Om op data te kunnen vertrouwen moeten we in control zijn over hoe data beheerd wordt. Data-governance is belangrijk voor het creëren van waarde van de data en het beheersen van de risico’s verbonden aan het managen en gebruik van deze data. Data-governance is de uitoefening van autoriteit en controle over datamanagement. Het zorgt ervoor dat datamanagement op de juiste manier wordt uitgevoerd. In de volksmond hebben we het vaak over “data-eigenaarschap” - het definiëren van beslissingsrechten, rollen en verantwoordelijkheden met betrekking tot data en datamanagement en het faciliteren daarvan. Een belangrijk aspect van data-governance is het bewaken van compliance en het ervoor zorgen dat datakwaliteitsprocessen uitgevoerd (kunnen) worden.

Voorbeelden zijn datakwaliteitsmanagement- en data governance volwassenheidsassessments van DAMA DMBOK.


02

Domeingerichte datakwaliteitsbeheer

 
Op de middellange termijn worden dataprofielen gemaakt en geanalyseerd om te kunnen bepalen waar en hoe de datakwaliteitsproblemen ontstaan – fase 1 (check). Dat is de nulmeting. Wat is nu de echte oorzaak van het probleem? Waar moet de organisatie direct op acteren – fase 2 (Act) en waar moet de organisatie in fase 3 (Plan) op concentreren om de problemen structureel aan te pakken. Waar focust de organisatie op de middellange termijn haar aandacht om de data nog beter te maken? Als deze plannen gemaakt zijn worden ze in fase 4 ‘gewoon’ uitgevoerd. En aan het einde van de afgesproken termijn, wordt de data weer gemeten (fase 1 - checken). De resultaten worden met de nulmeting vergeleken om te zien of de interventies het gewenste effecten hebben gehad. En zo begint de cyclus weer opnieuw.

Voorbeelden betreffen audits tegen normen die opgesteld zijn uit de programma van functionele eisen of normen die voortkomen uit het logisch data model. 

03

Systeemgerichte datakwaliteitsbeheer

 
Data opschoning is een actie die genomen wordt om de data zo snel mogelijk geschikt te maken voor een bepaald doel. Datasets worden vaak geschoond ten behoeve van een data-analyse, maar iedere keer dat er nieuwe data beschikbaar komt uit de bronsystemen moet deze data weer opgeschoond worden. Feitelijk is data-schoning “dweilen met de kraan open”. Met andere woorden, je maakt de data tijdelijk bruikbaar, maar je lost de onderliggende problemen – die al ontstaan in de bronsystemen - niet op. Vanwege een operationele noodzaak zijn tijdelijke oplossingen vaak noodzakelijk; de operatie heeft zijn focus met name op een goede afhandeling van het proces en minder op het per se juist muteren in systemen, zeker als deze systemen niet gebruiksvriendelijk en intuïtief werken. Belangrijk is om deze mutaties zichtbaar te maken door de data lineage in kaart te brengen. 

Een voorbeeld van audits naar de integriteit van data-schoning betreft de beoordeling van een data migratie of data-integratieproces.

Kwaliteitsstandaarden op gebied van datakwaliteit zijn o.a. ISO 8000 (Data quality and enterprise master data), ISO 25000 (Software and data quality) en ISO 19157 (Data quality).