{"id":80666,"date":"2019-08-18T15:52:56","date_gmt":"2019-08-18T15:52:56","guid":{"rendered":"https:\/\/hanstimmerman.me\/?p=80666"},"modified":"2019-08-18T15:53:41","modified_gmt":"2019-08-18T15:53:41","slug":"het-is-tijd-dat-we-data-gaan-zien-als-taal","status":"publish","type":"post","link":"https:\/\/hanstimmerman.me\/en\/het-is-tijd-dat-we-data-gaan-zien-als-taal\/","title":{"rendered":"Het is tijd dat we data gaan zien als taal"},"content":{"rendered":"<p>Overal ter wereld leren we de taal van het land waar je geboren wordt. In onze jonge jaren leren we er wellicht nog enkele buitenlandse talen bij. In de informatiemaatschappij die nu ontstaat, wordt data ook een steeds belangrijkere \u2018taal\u2019. Met data en de daaruit opgebouwde digitale informatie communiceren we onderling steeds directer. En hoe sterker we afhankelijk worden van alle data, hoe belangrijker het is om te bepalen hoe we data moeten zien en hoe we deze moeten interpreteren.<!--more--><\/p>\n<p>Het artikel \u2018<a href=\"http:\/\/www.ictmagazine.nl\/achter-het-nieuws\/bedrijfsstrategie-leer-iedereen-data-als-tweede-taal\/\">Leer iedereen data als tweede taal<\/a>\u2019 citeert Frank Buytendijk van Gartner, die vorig jaar een lezing hield over dit onderwerp: \u201cE\u00e9n van de belangrijkste initiatieven voor de komende jaren is het cre\u00ebren van <em>data-alfabetisme<\/em>: leren data lezen.\u201d De boodschap van Buytendijk is dat we het digitale \u2018gekwebbel\u2019 op sociale media, in persberichten en jaarverslagen beter moeten kunnen interpreteren. De data is er immers al, dus we moeten proberen als mens al die data als boodschap sneller te synthetiseren en te begrijpen. Dat is lastiger dan men denkt omdat we dan data op een taalkundige wijze moeten kunnen begrijpen.<\/p>\n<p><strong>Abstractie<br \/>\n<\/strong>Een Gartner-studie over nieuwe \u2018<a href=\"https:\/\/www.gartner.com\/doc\/3500835\/maverick-research-revolutionizing-data-management\">data mesh networks\u2019<\/a> gaat dieper in op data als levende taal. Een taal die niet dood is, zoals Latijn, maar elke dag weer veranderingen ondergaat. Een taal waarmee telkens nieuwe informatie wordt gemaakt. Een taal die zich steeds dieper in de haarvaten van onze belevingswereld nestelt. Naast het alom aanwezige internet digitaliseren we met IoT intussen dode materie om ons heen. De levende en dode wereld gaan data met elkaar uitwisselen: het niet begrijpen van die taal maakt je een data-analfabeet.<\/p>\n<p>Data is naast gesproken taal mede een sociale communicatievorm geworden. Het overstijgt culturen en kan elk mogelijk logische concept representeren dat het menselijke brein kan bedenken. Elke taal heeft verschillende lagen van abstractie en voor \u2018<em>data als taal\u2019<\/em>is dat niet anders. En metadata is de aangewezen plek om daar afspraken over te maken. Metadata kan beschrijven hoe we data moeten interpreteren en op welk abstractieniveau die data betekenis heeft.<\/p>\n<p><strong>Data als taal<br \/>\n<\/strong>Als we data als een taal beschouwen, moeten we het niet slechts zien als gegevens over transacties, rapporten en analyses. Data is dan een communicatiemedium, losgekoppeld van eigenaarschap en specifieke usecases. Een taal die van iedereen is en die we allemaal vrij mogen en kunnen gebruiken. Net zoals bij natuurlijke talen voegen we allemaal onze eigen ervaringen toe aan onze spraak, we spreken immers allemaal vanuit sociale achtergrond, ervaringen en inzichten.<\/p>\n<p>Taal bestaat uit drie lagen: de letters of symbolen om woorden en zinnen te maken, de sociale samenhang en betekenis van een boodschap en tenslotte het medium dat we voor communicatie gebruiken. Taal is meer dan een simpel lineair, algebra\u00efsch proces: het bestaat uit semantiek, zinsbouw en grammatica. Het faciliteert communicatie in een context vanuit verschillende perspectieven. Als data een taal is dan moeten we kijken naar de lingu\u00efstieke interpretatie van de data. Dan is de data-boodschap niet meer puur algebra\u00efsch opgebouwd, maar wordt net zo interpreteerbaar als natuurlijke tekst.<\/p>\n<p><strong>Datavaardigheid<br \/>\n<\/strong>Klinkt allemaal ingewikkeld, maar de waarde van data is in eerste instantie bepaald door de bron. De kwaliteit van de boodschap en de kwaliteit waarmee het gemaakt is, de reden van het bestaan en de (soms verborgen) reden dat de data is gecre\u00eberd. Dat betekent dat we moeten weten w\u00e1\u00e1r data in een informatie-infrastructuur is ontstaan, omdat dat veel zegt over de creatie zelf. Omdat bij \u2018<em>data als taal<\/em>\u2019 het strikte aspect data-eigenaarschap vervalt, wordt \u2018<em>data als taal\u2019<\/em>een boodschap voor en van ons allemaal. En vraagt algemene richtlijnen hoe we die data dan structureren en hiervoor de gewenste semantiek, zinsbouw en grammatica afspreken.<\/p>\n<p>Het Information Capabilities Framework (ICF) van Gartner <a href=\"https:\/\/www.gartner.com\/doc\/2760620\/introduction-gartners-information-capabilities-framework\">beschrijft<\/a> een generieke aanpak voor informatie architecten om van data een taal te maken. Eigenlijk zou iedereen die met informatie werkt deze principes moeten kennen. Net zoals elk kind op school vaardigheden leert om zijn moedertaal te spreken. Je kan het data-vaardigheid noemen, als onderdeel van de digitale vaardigheden die de mens in de digitale maatschappij moet beheersen.<\/p>\n<p>Data hebben we altijd gezien als een logische set gegevens uit een proces of operatie die op een bepaalde fysieke manier is samengesteld. Datafysica \u2013 hoe data fysiek is gemaakt \u2013 en datalogica \u2013 de boodschap van die data &#8211; hadden weinig met elkaar te maken. Fysica is technisch en rechtlijnig: verbindingen, lezen, schrijven, volume, compressie. Data wordt op dezelfde rechtlijnige wijze bewerkt, opgeslagen en bewaard. Maar als data een taal is die in een context en sociale samenhang moet worden beschouwd, is die kale rechtlijnigheid onhandig. Immers de intentie, de context in de tijd en de sociale interpretatie moeten dan ook worden bewaard.<\/p>\n<p><strong>Data Mesh Netwerken<br \/>\n<\/strong>Tussen de sociale omgang hoe wij \u2018data als taal\u2019 gebruiken om te communiceren en het fysieke datanetwerk, waar data als kale data wordt gecre\u00eberd, verbonden en opgeslagen, is een tussenlaag nodig die data naar taal vertaalt. Dat is een \u2018vermaasd\u2019 netwerk waar we de metadata van al die data met elkaar kunnen relateren. Waar we de context, de gebruikte semantiek, zinsbouw en grammatica vastleggen van zeg maar de lingu\u00efstieke interpretatie van data.<\/p>\n<p>Dat vraagt nieuwe vormen van meta-datamanagement. Hoe gaan we van data opgebouwd uit symbolen en letters, woorden en begrippen maken? Hoe gaan we die woorden vastleggen en in zinnen beschrijven opdat we ze kunnen gebruiken voor onderlinge communicatie. Hoe bruikbaar zijn \u2018tokens\u2019 daarvoor, in onze informatiewereld een veel gebruikte manier voor een gevalideerde representatie van een feit, bewijs of kwaliteit. Een token als identificatie of bewijsstuk levert vooral in sociale structuren gewenste betrouwbaarheid in communicatie.<\/p>\n<p><strong>Intelligentere data<br \/>\n<\/strong>Door tokens ook semantisch te gebruiken, krijgen we de bouwstenen om data werkelijk als taal te gaan toepassen. Daarmee kunnen we \u2018dingen\u2019 intelligenter maken waardoor ze in plaats van platte, rechtlijnige data veel meer intelligente boodschappen kunnen uitwisselen. Denk aan auto\u2019s die naast of achter elkaar rijden en over hun positie en plannen willen communiceren. De wereld rond elke auto verandert ieder moment maar de afgesproken taal die zij onderling spreken, moet hetzelfde blijven. Data als taal is dus zeker ook interessant voor de opkomende wereld van het Internet of Things.<\/p>\n<p>Als uw brandmelder of deurslot wil communiceren met uw bewakingssysteem, uw ijskast met uw slimme keuken en uw elektriciteitsmeter met uw slimme huis is \u2018data als taal\u2019 bijna een voorwaarde. Hoe mooi zou het zijn als die taal ook voor ons mensen begrijpelijk wordt en we die taal ook sociaal breder kunnen gebruiken. En makkelijker met de digitale wereld om ons kunnen communiceren. Een nieuwe taal die data \u00e9n zijn gebruik en context beschrijft en niet slechts zijn oorsprong, metrische waarde en algebra\u00efsche vorm of structuur.<\/p>\n<p>&nbsp;<\/p>\n<p><em>Deze blog was eerder gepubliceerd op www.datacentered.nl op 17 juli 2018<\/em><\/p>","protected":false},"excerpt":{"rendered":"<p>Overal ter wereld leren we de taal van het land waar je geboren wordt. In onze jonge jaren leren we [&hellip;]<\/p>","protected":false},"author":3,"featured_media":80668,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[72,75,76,80],"tags":[110,81,87],"class_list":["post-80666","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-digitalisation","category-innovation","category-internet-of-things","category-trusted-it","tag-internet-of-things","tag-strategie","tag-digitalisering"],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/hanstimmerman.me\/wp-content\/uploads\/2019\/08\/admin-ajax.php_.jpeg?fit=400%2C400&ssl=1","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/posts\/80666","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/comments?post=80666"}],"version-history":[{"count":3,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/posts\/80666\/revisions"}],"predecessor-version":[{"id":80670,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/posts\/80666\/revisions\/80670"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/media\/80668"}],"wp:attachment":[{"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/media?parent=80666"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/categories?post=80666"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/tags?post=80666"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}