Open data: het zwarte goud van de 21ste eeuw

De stikstofdiscussie, de protesten van boeren, bouwers en zorgaanbieders maken één ding duidelijk. De burger kan niet meer vertrouwen op de verhalen en data die de overheid verschaft. Wie sterk wil staan in een gevecht met de overheid, doet er goed aan zelf over de juiste en betrouwbare (trust) data te beschikken. Tot voor kort was dat een hele opgave. In zaken zoals de stikstofdiscussie blijkt de overheid als enige de beschikking te hebben over de gebruikte “intelligentie”, waardoor de burger het nakijken heeft. Maar gelukkig staan ons steeds meer open-data-bronnen ter beschikking waar we als burger en bedrijven zelf de data uit kunnen halen. Na mijn pensionering bij DellEMC ben ik directeur bij Fortierra geworden, een bedrijf dat de afgelopen tien jaar de uitdaging aanging om zoveel mogelijk open brondata te verzamelen en beschikbaar te krijgen voor toepassingen in onze woon-, leef en thuiszorgomgeving.

Open data uitdagingen
Maar die missie was een hele uitdaging. Want waar vind je de brondata die wilt hebben? Hoe is die brondata door de creator opgesteld en wat betekent de data zelf? Wat is de waarde van de gevonden data in tijd, nauwkeurigheid en betekenis? Elke bron blijkt gevuld met ruwe data waar de betreffende organisatie vrijwillig of door de overheid verplicht toegang tot verleent. Maar daar houdt het in veel gevallen mee op. Nieuwe data vervangt oude data en versiebeheer wordt dan lastig. Wanneer is het voor het laatst ververst en wanneer komt er weer een update? Als data eens in de vijf jaar wordt ge-update (en dat gebeurt!), dan weet je na 4,5 jaar dat die data niet meer actueel is, maar je moet toch een half jaar wachten op een actuelere versie.

Daarnaast is veel ruwe data afkomstig van interne systemen die op geen enkele wijze zijn gestandaardiseerd of voldoen aan algemene wetgeving. De wet hergebruik van overheids-informatie uit 2015 is ontstaan vanuit de Europese richtlijn 2003/98/EG uit 2003. Deze richtlijn komt voort uit de afspraak om vervalsing van de mededinging op de interne markt te voorkomen en de wens een informatie- en kennismaatschappij te ontwikkelen die elke EU-burger toegang biedt tot openbare data die overheden verzamelen, produceren, vermenigvuldigen en verspreiden. Het algemene beginsel van deze richtlijn is dat lidstaten ervoor moeten zorgen dat hergebruik van documenten is toegestaan en dat deze documenten kunnen worden gebruikt voor commerciële en niet-commerciële doeleinden.

Europa staat voorop Als we open data willen gebruiken dan is het logisch een Europees vertrekpunt te kiezen. Daarmee is immers gelijk toepassing binnen de hele EU mogelijk. Maar de lidstaten mogen hun documenten beschikbaar stellen in ‘eender welk reeds bestaand formaat of eender welke taal, indien mogelijk en passend langs elektronische weg’. Er is dus geen verplichte standaardisatie waarin deze data en informatie ter beschikking wordt gesteld. Daarnaast worden openbare lichamen niet verplicht hun documenten te blijven produceren met slechts het oog op hergebruik van deze documenten door een particuliere of publieke organisatie. Dit houdt dus een mate van vrijblijvendheid in, maar er zijn afspraken over licenties mogelijk en er is een verbod op exclusiviteitsregelingen. Open data is op Europees niveau dus best goed geregeld.

Data wordt verstrekt voor zover deze bij de instelling aanwezig is. En samen met de metadata langs elektronische weg aangeboden in een open en machinaal leesbaar formaat, dat voor zover mogelijk voldoet aan formele open standaarden zoals de Europese richtlijn bepaalt. In een studie van de TU Delft over de maatschappelijke kosten-baten analyse open data blijkt dat de kosten van het als open data beschikbaar stellen van overheidsdata laag zijn, mits de data met een geringe bewerkingsslag kunnen worden gepubliceerd. Op de website data.overheid.nl staat het dataregister van de Nederlandse overheid. Er zijn momenteel 14.606 beschikbare datasets op deze website te vinden. De Wet open overheid (Woo) is een initiatiefwet uit 2012 die tot doel heeft overheden en semi-overheden transparanter te maken. Zorgen dat overheidsinformatie beter vindbaar, uitwisselbaar, eenvoudig te ontsluiten en goed te archiveren is. Een flinke klus!

Hoe ver zijn we?
Bij de laatste stikstof- en PFAS-discussies bleek dat het werkelijk vinden en kunnen inzien van alle relevante data op dat gebied nog steeds best lastig is. De overheid blijkt ook nog verborgen achterliggende ‘intelligentie’ te bezitten die uiteindelijk de betekenis en de waarde van de gepresenteerde data beperkt. Wat is precies gemeten? Waar is het gemeten en op welke wijze? Een temperatuur is eenduidig maar de plek waar, wanneer en met welke precisie die gemeten is, maakt het getoonde cijfer opeens minder arbitrair. Zo zien we in discussies over klimaat-verandering dat thermometers in ‘meethutten’ een over de jaren oplopende temperatuur laten zien. Maar we weten ook dat urbanisatie, de verstening van onze steden en maatschappij, voor hogere omgevingstemperaturen zorgt. Als de meethut ‘last’ heeft van deze omringende verstening, komt de gemeten verhoging van de temperatuur in een heel ander daglicht te staan.

Heel veel stikstof -en fijnstofconcentraties zijn berekend op basis van modellen en nog best relatief weinig metingen. Hoe goed zijn die rekenmodellen? Wanneer is voor het laatste gemeten en wat is intussen in die omgeving veranderd? Allemaal reële vragen die met moderne techniek steeds beter kunnen worden ingevuld. Het Internet of Things geeft ons een groeiende infrastructuur met steeds meer sensoren en dus – ook particuliere – meetpunten in de publieke ruimte. Overheden en bedrijven zijn de afgelopen jaren steeds vaker open data gaan gebruiken, maar de omvang van en de zoektocht naar die data is groot. Nog los van de kwaliteit, de actualiteit en de achterliggende betekenis van die gevonden data.

Bestaansrecht van Fortierra
Fortierra heeft zich gespecialiseerd in het ophalen van data uit openbare databases. Dat zijn er in Nederland op dit moment ruim 450. De verzamelde data wordt eerst gestandaardiseerd op basis van de EU Standaard Business Registratie, zie mijn eerdere blog daarover. Daarna wordt de data in lijn gebracht met ISO en NEN-richtlijnen, opdat we over eenduidige legenda’s en meetwaarden spreken.  Vervolgens wordt het getoetst aan (internationale) wetgeving en hierbij geldende technische- en economische standaarden. Sommige wetten beschrijven specifieke normen en eenheden waartegen data moet worden vergeleken. Op die manier is door Fortierra intussen een enorme Big Data catalogus gebouwd met ruim 700 prestatie-kaarten over de woon-, werk- en leefomgeving, inclusief bijbehorende historische data.

Op basis van deze prestatiekaarten kunnen bijvoorbeeld bedrijven eigen conclusies trekken over mogelijke vestigingsplaatsen. In discussies met regionale overheden staan ze sterker, omdat ze over actuele- en trendwaarde data met analyse beschikken. Het doet de burger, huurder of huiseigenaar sterker staan in zijn contacten met de overheid (als WOZ-verantwoordelijke), maar ook de woningcorporatie met betrekking waarderingspunten en de uitvoering van de zorgwet. Het kan de burger ook helpen in zijn overweging wel of niet zonnepanelen op zijn dak te leggen of wel of niet te investeren in een warmtepomp. Maar we ondersteunen ook gemeenten met data-atlassen voor energietransities of de nieuwe omgevingswet die in 2021 wordt ingevoerd.

Trustdata zal steeds meer het zwarte goud in onze maatschappij worden: gecertificeerde data die conformiteit kan bieden in onze complexe maatschappij, zowel vóór (publiek) als àchter (privaat) de voordeur: onze woon-, leef- en thuiszorgomgeving.

Photo by Zane Lee on Unsplash