Data sandbox tooling: centrale ondersteuning, lokaal beheer?
In de WhatsApp groep voor Data Experts van het CIO Platform Nederland ontvingen we een vraag over ervaringen met het beschikbaar stellen van een data sandbox voor business toepassingen. De sandbox zelf is een middel naar het creëren van een meer en meer datagedreven organisatie. Het hieronder volgende artikel is opgesteld voor iedereen die nog geen ervaringen heeft met data sandbox, maar wel midden in de transformatie naar een datagedreven organisatie zit.
In de CC (CIO Commitee) Transformation, met belangrijke sponsor Kees Jans vanuit Wehkamp, stond data democratization* centraal voor 2020. Beide onderwerpen vullen elkaar prachtig aan en geven stof tot nadenken nu data tooling, datastrategie en datagedreven business meer dan ooit actueel zijn bij de leden van het CIO Platform Nederland. Uit de sessie die we 3 december j.l. organiseerden blijkt dat de volgende overwegingen van belang zijn: of je het tijdelijk inricht of met een meer permanent karakter, dat er daadwerkelijke innovaties uit naar voren komen, hoe de toegang naar de datalake wordt geregeld en de kwaliteit van de data (is afhankelijk van je datastrategie).
Welke data-doelstellingen worden nagestreefd voor de verschillende gebruikersgroepen?
Met een kleine vertegenwoordiging uit de kennisgroep CEG Data hebben we een uitvoerige discussie om ervaringen uit te wisselen over wat er geregeld moet worden bij het ‘beschikbaar stellen’ van data aan de gehele organisatie middels een sandbox. Al snel gaat het gesprek over inspelen op de behoeftes van de gebruikers. Iedere gebruikersgroep vraagt andere tooling en uitgangspunten waar ook ruimte voor moet zijn. Er zijn uiteenlopende data gerelateerde rollen die essentieel zijn aan zowel de business kant als de IT kant om aandacht aan te geven. Zorg ervoor dat de teams autonoom kunnen werken, dus zelf dashboards kunnen bouwen en beheren waarbij alle vrijheid bestaat om met de data aan de slag te gaan. Wat past bij de cultuur en hoe datagedreven is men, over alle lagen van de organisatie heen. Trainen van management, RvB en commissarissen als ook het opzetten van de “coalition of the willing” zorgen ervoor dat grote stappen kunnen worden gezet.
De IT gerelateerde of centrale werkzaamheden zijn het verlenen van support, geven van opleidingen, hulp bieden bij complexere vragen als ook zorgen voor uniforme toolkeuze, en natuurlijk dat er voldaan wordt aan de security en privacy vereisten. Voorkom afhankelijkheid van 1 persoon en creëer collegiale support, schaalvoordeel en ownership.
Groeien met data
In de data governance balanceer je de impact van het wijzigen van het databeleid. Hoe betrokken men is met de data, welke bronsystemen komen samen, wat wordt aan de data toegevoegd of verfijnd of opgeschoond, en hoe wordt de continuïteit geborgd? Dus naast de wensen van de gebruikers - wat is men gewend, bouwt business zelf, welke data moet beschikbaar komen - gaat het over dashboards bouwen of doen van grondige analyses, realtime of batch verwerking, hoe wendbaar is het, etc.
Een datacultuur
Aanpassingen in cloud data lakes van grote ERP aanbieders realiseren kost veel lobby-inspanning. Om mensen mee te krijgen, om brede beschikbaarheid te blijven garanderen, enz. Verschuiven van de datacultuur kost veel energie, is lastig, maar is cruciaal. Men is snel gewend om met een tool/report te werken, maar waarde creëer je door meer of andere dwarsdoorsnedes te maken, wendbaar te zijn en future proof. Tech of ICT is nooit in de lead, maar vaak wel de aanjager. Zorg dat de afdelingsmanagers mee gaan in deze golf om kansen te spotten. De datastrategie is van de hele organisatie, dus stem je evangelisatie af op die organisatie. Maak het specifiek en uitlegbaar; hoe regel je het beheer, wie is de ‘eigenaar’ van de data en van het datamodel (incl. afhankelijkheden) en wie van de bronsystemen?
Data is een vak!
De waarde van data wordt juist ontleend aan de besluiten die genomen worden op een groot aantal analyses en andere data dan die voorheen beschikbaar was. Maak een duidelijke knip tussen beheer, operatie en ontwikkeling. Data is een vak en werkt alleen over de hele keten en alle processen heen. Hoe meer er is gestandaardiseerd, hoe waardevoller de analyses. Schuif eens aan bij belangrijke touch points in de journey die de data aflegt. Kijk eens hoe de tool wordt gebruikt waarmee de data wordt opgehaald, dat blijkt voor alle bedrijven een belangrijke graad voor de kwaliteit. Waarbij direct ook de term relevantie om de hoek komt kijken. Hoe relevanter de inzichten, hoe meer men hecht aan goede registraties. Andersom is ook het geval, natuurlijk.
De data sandbox
Met het verder groeien van standaarden bestaat de kans ook organisatieoverstijgend te werken in de sector. Bijvoorbeeld in de zorg. Essentieel is te weten waar de data vandaan komt, hoe die wordt gegenereerd en in welke context het wordt geregistreerd. Standaardiseer de context! Een sandbox wordt ingericht om te experimenteren, kijk wat er ‘gecreëerd’ wordt en hoe en wie dat daarna moet gaan beheren. Ga verder met ‘het stukje toeval’, laat het beklijven in de business en draag het over aan je business. IT/BI is servicegericht, maak van tevoren goede afspraken over ontwikkelen, bouwen en beheren. Start met een innovatie budget in de sandbox, wat neem je op in de business case over het klaarmaken en overdragen aan business?
Future proof
Data is een vak! Dat komt meerdere keren terug. Hoe bewaak je de lijnen tussen centraal en decentraal, beheer en ontwikkeling. Wees bewust van de risico’s die je loopt en waar je eventueel inboet op de snelheid. Het ontsluiten en het koppelen van data, de next step is business toegang op machine learning te geven. Voordat daartoe succesvol kan worden overgegaan is een volwassen blik op wat de data is en kan doen cruciaal. Wat betekenen de inzichten, welke antwoorden komen tot stand en wie valideert die antwoorden? Met de toenemende hoeveelheid datastromen in je organisatie en daarmee de hoeveelheid bronnen, groeit ook de complexiteit. Hou daarmee rekening. Ga serieus om met dat vak, je doet het er niet even bij!
* Definition data democratization (Bernard Marr) we are using: Data democratization means that everybody has access to data and there are no gatekeepers that create a bottleneck at the gateway to the data. It requires that we accompany the access with an easy way for people to understand the data so that they can use it to expedite decision-making and uncover opportunities for an organization. The goal is to have anybody use data at any time to make decisions with no barriers to access or understanding.
Deel dit bericht