Data zonder betekenis is waardeloos.
Deze blog is eerder gepubliceerd op 15 maart 2015
Deze blog is voor het eerst dit jaar weer buiten in de zon op mijn terras geschreven, waar ik vanmorgen nog net een glimp kon opvangen van de gedeeltelijke zonsverduistering. Zo’n 15 jaar geleden heb ik de volledige zonsverduistering meegemaakt in Noord-Frankrijk. We waren in een dorpje dat op een heuvel was gebouwd, waardoor je in de verte de schaduwlijn over het land naar je toe zag komen. En, alsof je met een dimmer het licht in de kamer uitdraaide, was het in 5 seconden volkomen duister. De vogels stopten met fluiten, alle toeschouwers waren doodstil en er ontstond een heel vreemde sfeer. Ik kan mij voorstellen dat er vroeger, toen wij nog weinig van ons zonnestelsel wisten, inderdaad paniek kon ontstaan omdat men aannam dat het einde van de wereld nabij was. Een waarneming – data – zonder te begrijpen wat er echt gebeurde.
Gelukkig weten we intussen de context van een zonsverduistering. We hebben kennis van het verschijnsel. We hebben informatie over waar en wanneer dit plaatsvindt en begrijpen dat het een kortdurend natuurverschijnsel is. Zodra je immers de context weet, wordt een waarneming – een gegeven – opeens betekenis vol.
Als iemand het getal 32 noemt, geeft dat weinig informatie. Hebben we het over leeftijd, gewicht, afstand? Als we er nu ‘Fahrenheit’ achter plaatsen, wordt al veel meer duidelijk. Dan gaat het over een Amerikaanse temperatuuraanduiding die wordt gekenmerkt als vriespunt, het is koud en ijs kan ontstaan. In Europa ook wel bekend als nul graden Celsius. Als we ook nog horen dat dit de buitentemperatuur is, dan wordt deze informatie de basis voor ons handelen. Want 32 graden Fahrenheit betekent dat als je naar buiten gaat, je een jas moet aantrekken.
Het grappige is dat als we dan met een jas buiten lopen, de activiteit ons bevestigt dat we het inderdaad niet koud hebben. Deze ervaring bevestigt dus weer onze kennis over hoe te reageren als het buiten koud is. En die informatie kan uiteindelijk weer opnieuw in data worden vastgelegd. Er is dus een logische cirkel van data àinformatie à kennis à actie. Maar het omgekeerde geldt ook: een actie kan tot begrip leiden, wat weer informatie oplevert en met data kan worden vastgelegd.
In de militaire wereld is dit de OODA keten: Observe, –> Orient, –> Decide en –> Act. Uit de observatie volgt data die tot een oriëntatie of toepassing leidt. Hieruit komen beslissingen die tot acties leiden. In de kwaliteitswereld kennen sommigen deze volgorde als de kwaliteitscirkel van Demming: Plan, Do, Check, Act. Kortom, data kan tot actie leiden en actie leidt weer tot data.
We kunnen deze keten ook vertalen naar de informatiewereld. In die context voedt data een applicatie, die op zijn beurt een interface heeft die ons of ‘iets’ tot actie aanzet. Data is dus de grondstof om inzicht te krijgen in de activiteiten die we zouden kunnen of moeten uitvoeren. En tegenwoordig is er data in overvloed. Het internet, onze sociale media, het Internet of Things, videosurveillance en ontelbare sensoren storten een vloed van data over ons uit. Gemiddeld maken/creëren we met elkaar wereldwijd zo’n 5 PB per uur. En elke twee jaar verdubbelt dat. Data genoeg dus om zinvolle acties uit af te leiden.
Helaas zijn we daar nog niet zo goed in. Een wetenschap in de dop, die gelukkig wel steeds meer techniek ter beschikking krijgt om intelligenter met data om te kunnen gaan. Grote dataverzamelingen waar we (snel) inzicht in willen hebben, om op die manier applicaties te kunnen bouwen die ons inzicht en argumenten geven om zinvolle activiteiten in gang te zetten. Om vervolgens de ervaringen van die activiteiten weer vast te leggen in nieuwe betrouwbare data. De keten van data naar intelligence. Intelligence die ons de wijsheid én argumenten geeft om slimme acties te ontplooien.
Dit klink voor elke organisatie fantastisch, want wie wil er nu niet slimmer acteren op wat er in de wereld en zijn omgeving gebeurt? Maar zoals gezegd, het is een wetenschap in de dop waar nog heel veel te leren en te ontwikkelen valt. Als we over 30 jaar terugkijken, beseffen we pas hoe minimaal onze mogelijkheden op dit moment (nog) zijn. Daarmee wil ik zeggen dat de komende decennia hele grote (écht hele grote) stappen vooruit gezet zullen worden op dit gebied. Ontwikkelingen als IBM’s Watson, Kunstmatige Intelligentie en Predictive Modelling op basis van analyse van Big Data zijn elk jaar nog aan het enorm versnellen. We zitten pas onderaan de golf.
Het is echter al wel tijd om er als organisatie eens aan te gaan ruiken. En wellicht al beperkt toe te gaan passen. We kennen allemaal de verhalen over hoe de grote internetbedrijven, die een fantastische voorraad relevante, digitaal beschikbare klantgegevens hebben verzameld, hier hun voordeel mee doen. Dat vraagt organisatie, deskundigheid, de juiste infrastructuur, visie en uithoudingsvermogen. Ondernemerschap dus, want zonder ondernemerschap geen vooruitgang.
Gelukkig is de techniek om grote data lakes – dataverzamelingen – te bouwen al redelijk ontwikkeld. En gelukkig ontwikkelt de kennis om dit soort relevante dataverzamelingen efficiënt bij elkaar te brengen en zinvol te gebruiken zich snel. Kennis om groeiende data te organiseren en gereed te maken voor zinvol gebruik. Goedkope opslag om dat allemaal te bewaren en informatie-technisch te kunnen gebruiken.
Deze week kondigen we de komst van zogenaamde Business Data Lake oplossingen aan. Dit zijn grote dataopslagomgevingen die de functionaliteit bieden die organisaties nodig hebben om efficiënte data-analyse processen mogelijk te maken. Geen algemene dataopslag of data warehouses, maar dynamische dataverzamelingen, speciaal ge-engineerd voor de wereld van Big Data en predictive modeling. Daardoor zijn ze geschikt om data te verzamelen, op te slaan, te analyseren, te presenteren en uiteindelijk te gebruiken om acties uit te voeren. Op die manier maken ze de keten “data, informatie, kennis en actie” mogelijk. En richten ze de gelieerde keten “data, applicatie, interface en actie” in, die kwaliteitscirkels als “plan, do, check, act” kunnen ondersteunen. Direct bruikbaar in elk business proces. Een mooie ontwikkeling.
Photo by Franki Chamaki on Unsplash