{"id":81663,"date":"2021-03-11T20:13:05","date_gmt":"2021-03-11T20:13:05","guid":{"rendered":"https:\/\/hanstimmerman.me\/?p=81663"},"modified":"2022-12-23T15:40:25","modified_gmt":"2022-12-23T15:40:25","slug":"repository-een-rustplaats-voor-data","status":"publish","type":"post","link":"https:\/\/hanstimmerman.me\/en\/repository-een-rustplaats-voor-data\/","title":{"rendered":"Repository, \u2018een rustplaats voor data\u2019"},"content":{"rendered":"<p><span style=\"color: #000000;\"><i>Te lezen met het prachtige\u00a0<\/i><a style=\"color: #000000;\" href=\"https:\/\/youtu.be\/ckM51xoTC2U\"><i>Radar Love als eerbetoon aan Golden Earring<\/i><\/a><i><span class=\"Apple-converted-space\">\u00a0 <\/span>. . .<span class=\"Apple-converted-space\">\u00a0<\/span><\/i><\/span><\/p>\n<h5><span style=\"color: #000000;\">Een repository is een centrale plaats waar computergegevens, data, software etc. is opgeslagen. Het wordt wel de \u2018<i>database van de database<\/i>\u2019 genoemd. De plaats waar de verwijzingen staan van alle data en informatie die voor een digitaal systeem van belang zijn. Was vroeger al die data bijna vanzelfsprekend binnen het eigen systeem opgeslagen, in de tijd van open data en clouds zien we dat het ook zinvol is om in de repository de links naar externe omgevingen te hebben. Het woord komt oorspronkelijk uit het Latijn: <i>respositoriu<\/i>, een rustplaats waar iets heiligs wordt bewaard. Het wordt ook in de kunstwereld gebruikt, waar identificatiecodes aan kunstvoorwerpen, boeken of andere objecten werden gegeven.\u00a0<\/span><\/h5>\n<p><span style=\"color: #000000;\"><b>Datawarehouse<\/b><\/span><\/p>\n<p><span style=\"color: #000000;\">In onze taal komt het woord weinig voor, maar een bekende Engelse uitdrukking is: \u2018<i>my father is a repository of family history.<\/i>&#8216; Wij spreken dan van een wandelende encyclopedie. De basis van een repository is dat niet de informatie zelf, maar de verwijzing naar en het waarom van die data bekend is. Vaak de metadata van een file, een document, software of code. Aangevuld met de historie, referenties en de geschiedenis en het \u2018waarom\u2019 van ontstaan en wijzigingen die in de bestanden zijn aangebracht. Belangrijke subsets in een repository zijn \u2018<i>datamarts<\/i>\u2019, zij bevatten vaak snapshots van verschillende soorten gegevens en zijn gericht op een bijzondere behoefte van specifieke gebruikers of bepaalde software.<span class=\"Apple-converted-space\">\u00a0<\/span><\/span><\/p>\n<p><span style=\"color: #000000;\">Een datawarehouse is ontworpen voor het databeheer door een data management systeem. Cruciaal om analytics en business intelligence activiteiten mogelijk te maken. Bij zoekopdrachten levert de repository de (locatie-) informatie waar die inhoudelijke informatie kan worden gevonden. Inclusief historische data over die actuele inhoudelijke data. We spreken ook wel over ETL: Extractie, Transformatie en Laden. Het verzamelen en voorbereiden van sets data om te k\u00fannen worden geanalyseerd. Daarbij wordt data getransformeerd naar een eenduidig formaat. Bijvoorbeeld verschillende datasets die respectievelijk als \u2018<i>voornaam\/achternaam<\/i>&#8216; maar ook als \u2018<i>achternaam\/voornaam<\/i>\u2019 zijn opgezet, moeten voor de analyse naar bijvoorbeeld uitsluitend \u2018<i>voornaam\/achternaam<\/i>\u2019 worden omgezet cq getransformeerd. Vervolgens kan deze set in de database worden geladen om eenduidig te worden geanalyseerd.<\/span><\/p>\n<p><span style=\"color: #000000;\">De komst van Big Data heeft begin deze eeuw tot innovatie in de ETL-wereld geleid omdat nieuwe gereedschappen nodig waren die de vele petabytes aan data snel konden \u2018extraheren, vertalen en laden\u2019. <a style=\"color: #000000;\" href=\"https:\/\/greenplum.org\/greenplum-etl\/\">Greenplum<\/a> is bijvoorbeeld zo\u2019n nieuwe database die geschikt is voor de nieuwe internetwereld en gebaseerd is op enerzijds <a style=\"color: #000000;\" href=\"https:\/\/en.wikipedia.org\/wiki\/Greenplum\">MPP<\/a> &#8211; \u2018Massively Paralel Processing\u2019 &#8211; en anderzijds Postgres open source database techniek. De basis van <a style=\"color: #000000;\" href=\"https:\/\/en.wikipedia.org\/wiki\/Massively_parallel\">MPP<\/a> is om parallel heel veel processoren gelijktijdig een opdracht te laten verwerken. De snelheid van moderne zoekmachines is gebaseerd op deze techniek van parallellisatie.<\/span><\/p>\n<p><span style=\"color: #000000;\"><b>Data management systeem<\/b><\/span><\/p>\n<p><span style=\"color: #000000;\">Datamanagement wordt steeds belangrijker in onze digitaliserende wereld. Het onderhouden, actualiseren, beheren en beveiligen van data. Zoals ik in mijn blogs al eerder beschreef, is een digitale transformatie slechts mogelijk als men enerzijds van de goed bekende gebruiker (klant) uitgaat en anderzijds vanuit de data denkt. Welke gebruikers met welke rollen heb ik en welke data met welke rechten zijn beschikbaar? Vervolgens kunnen allerhande processen en workflows worden gedefinieerd die de combinatie van specifieke gebruiker en relevante data verpakt in een proces of gewenste workflow.<\/span><\/p>\n<p><span style=\"color: #000000;\">Hier zie je het succes van de <a style=\"color: #000000;\" href=\"https:\/\/www.riskcompliance.nl\/news\/no-code-applicaties-ontwikkelen\/\">nieuwe<\/a> no-code platformen. Tussen gestructureerde gebruikers en gestructureerde data kunnen snel en eenvoudig workflows wordt gecre\u00eberd. Deze workflows zijn vluchtig, de data en de gebruikers (cq rollen) zijn de vaste gegevens. Overeenkomstig mijn bekende rijmpje: <i>applicaties verwelken, processen vergaan, maar onze data blijft altijd bestaan. <\/i>Dan bedoel ik natuurlijk data van waarde. Die waard is om gemaakt te worden en &#8211; belangrijker &#8211; bewaard te worden en een rustplaats te gunnen: de repository.<span class=\"Apple-converted-space\">\u00a0<\/span><\/span><\/p>\n<p><span style=\"color: #000000;\">We worden tegenwoordig overspoeld met realtime streaming data. Die stroom is z\u00f3 groot, dat we de fysieke opslagmiddelen voor die hoeveelheid data niet eens (meer) hebben. Steeds meer data in onze wereld kan niet meer worden opgeslagen, omdat dat zowel fysiek als financieel niet meer kan. Dat betekent dat de data die we (nog) wel kunnen opslaan, goed gestructureerd en \u2018terugvindbaar\u2019 moet zijn, dus voorzien van de juiste metadata. Anders worden we een dementerende maatschappij die zijn verleden langzaam vergeet en in vergetelheid ziet oplossen. Helaas voor veel organisaties best een confronterende conclusie.<span class=\"Apple-converted-space\">\u00a0<\/span><\/span><\/p>\n<p><span style=\"color: #000000;\"><b>Verdrinken in de data<\/b><\/span><\/p>\n<p><span style=\"color: #000000;\">In een eerdere <a style=\"color: #000000;\" href=\"https:\/\/dutchitchannel.nl\/618375\/verdrinkt-de-overheid-in-zijn-eigen-data.html\">blog <\/a>schreef ik over hoe de overheid langzaam in zijn eigen digitale data dreigt te verdrinken. De Wet Open Overheid (Woo) is een initiatiefvoorstel uit 2012 van Groen Links en D66. Deze wet dient de wet openbaarheid bestuur (WOB) te vervangen. Bij de WOB kan men achteraf inzage vragen over overheidsdata. De Woo is er op gericht dat al direct bij publicatie van overheidsinformatie de inhoud openbaar is. Slechts de ambtelijke notities en interne procescommunicatie blijft dan binnen de overheid. In de noordelijke landen is dit al een bewezen praktijk: actieve openbaarmaking van overheidsinformatie. Immers de overheid is van en voor ons &#8211; de maatschappij &#8211; dus is overheidsdata vanzelfsprekend ook openbaar (op veiligheidszaken na natuurlijk) en ook eigendom van de maatschappij.<\/span><\/p>\n<p><span style=\"color: #000000;\">Vier jaar later, in 2016 stemde de kamer in met dit initiatiefvoorstel maar er waren zorgen over de kosten en de uitvoerbaarheid van de wet. De overheid (!) vond de uitvoering te duur en onuitvoerbaar. Intussen is de Woo aangepast en is &#8211; bijna tien jaar later- op 26 januari 2021 met een aantal moties en amendementen aangenomen door de Tweede kamer. En zal dus tien jaar later in 2022 in werking treden. Het zal nog vele jaren duren voordat de overheid in staat zal zijn volkomen volgens deze wet te werken, omdat veel systemen hieraan moeten worden aangepast.<span class=\"Apple-converted-space\">\u00a0 <\/span>Meer informatie is te vinden op de <a style=\"color: #000000;\" href=\"https:\/\/www.informatiehuishouding.nl\/onderwerpen\/rddi\">website<\/a> van het Rijksprogramma voor duurzame digitale informatiehuishouding. <span class=\"Apple-converted-space\">\u00a0<\/span><\/span><\/p>\n<p><span style=\"color: #000000;\"><b>Plooi<\/b><\/span><\/p>\n<p><span style=\"color: #000000;\">Naast de Woo is er ook een platform nodig om deze data ter beschikking te kunnen stellen. Dat platform heet Plooi: Platform Open Overheids Informatie. Dit gebeurt door al deze informatie op een centrale plek op gebruiksvriendelijke manier beschikbaar te stellen. Een belangrijk middel om overheidsinformatie ook op een gestandaardiseerde manier openbaar en vindbaar te maken. Want daar ontbreekt het op dit moment best aan. De vele overheden (Rijk, provincie, gemeente en aanverwante organisaties als waterschappen etc.) hanteren tot op heden vaak nog eigen standaarden en data definities. Heerlijk als je gemeentedata, provinciedata, rijksdata wilt combineren met RIVM, Tennet en Rijkswaterstaat data.<span class=\"Apple-converted-space\">\u00a0<\/span><\/span><\/p>\n<p><span style=\"color: #000000;\">Langzaam en met kleine stapjes wordt de overheid doorzichtiger en wordt burger en bedrijfsleven (weer) eigenaar van hun eigen overheidsdata. Een ontwikkeling die wel door Europa wordt gedreven. Zelf ben ik geen erg grote Europa-fan, maar op het gebied van datagerichte wetgeving, standaarden en normen dwingen ze de lidstaten wel tot meer openheid en consistentie op dit gebied. Dat is gelijkertijd ook de democratische kracht in Europa die de burger ondersteunt in haar rechten, versus China waar de partij de macht heeft en de USA waar de markt de macht heeft.<span class=\"Apple-converted-space\">\u00a0<\/span><\/span><\/p>\n<p><span style=\"color: #000000;\">Photo by <a style=\"color: #000000;\" href=\"https:\/\/unsplash.com\/@chiabra?utm_source=unsplash&amp;utm_medium=referral&amp;utm_content=creditCopyText\">Paolo Chiabrando<\/a> on <a style=\"color: #000000;\">Unsplash<\/a><\/span><\/p>","protected":false},"excerpt":{"rendered":"<p>Langzaam en met kleine stapjes wordt de overheid doorzichtiger en wordt burger en bedrijfsleven (weer) eigenaar van hun eigen overheidsdata. Een ontwikkeling die wel door Europa wordt gedreven. Zelf ben ik geen erg grote Europa-fan, maar op het gebied van datagerichte wetgeving, standaarden en normen dwingen ze de lidstaten wel tot meer openheid en consistentie op dit gebied. Dat is gelijkertijd ook de democratische kracht in Europa die de burger ondersteunt in haar rechten, versus China waar de partij de macht heeft en de USA waar de markt de macht heeft.\u00a0<\/p>","protected":false},"author":3,"featured_media":81666,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[70,71,72,75,78,80,138],"tags":[107,117,130,82,84],"class_list":["post-81663","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ownership","category-digital-economy","category-digitalisation","category-innovation","category-storage","category-trusted-it","category-strategie","tag-data","tag-open-data","tag-digitale-platformen","tag-transformatie","tag-compliance"],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/hanstimmerman.me\/wp-content\/uploads\/2021\/03\/paolo-chiabrando-dMGV2jJShdo-unsplash-scaled-e1615493450616.jpg?fit=2553%2C947&ssl=1","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/posts\/81663","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/comments?post=81663"}],"version-history":[{"count":6,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/posts\/81663\/revisions"}],"predecessor-version":[{"id":83012,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/posts\/81663\/revisions\/83012"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/media\/81666"}],"wp:attachment":[{"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/media?parent=81663"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/categories?post=81663"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/hanstimmerman.me\/en\/wp-json\/wp\/v2\/tags?post=81663"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}