Legosteentjes en een federatief datastelsel

Vrijwel iedereen heeft wel eens met Lego gespeeld: die kleurrijke, in elkaar grijpende steentjes waarmee je van alles kunt bouwen, van een simpel huis tot een complexe robot. Lego ontstond als houten speelgoed in de werkplaats van Ole Kirk Christiansen in Denemarken. Het woord is een afkorting van het Deense ‘leg godt’ (‘speel goed’) en sinds 1947 beschikbaar in de bekende plastic uitvoering. Wat Lego zo bijzonder maakt, is dat elk steentje, ongeacht vorm of kleur, kan bijdragen aan een groter geheel — of dat nu een kasteel, een auto, of een vliegtuig is. Het biedt eindeloze mogelijkheden voor creativiteit. Je kunt er zelfs kathedralen mee bouwen. 
Maar Lego heeft ons meer te bieden dan alleen plezier. Het illustreert namelijk prachtig hoe je complexe structuren kunt opbouwen uit eenvoudige componenten, een concept dat we ook kunnen toepassen op data en informatiemanagement.

De kracht van classificatie

Bij het spelen met Lego ordenen veel mensen de steentjes: de ‘viertjes’ bij de ‘viertjes’, de rode steentjes apart van de blauwe. Deze classificatie maakt bouwen makkelijker. Dit principe van organiseren en structureren wordt in de industrie vaak toegepast, bijvoorbeeld bij groepentechnologie — een methodiek ontwikkeld door TNO om productieprocessen te structureren en optimaliseren. Dit kun je zien als een soort ‘federatief onderdelenstelsel’ dat verschillende groepen onderdelen samenbrengt en ordent op basis van specifieke eigenschappen.

De stap van het classificeren van fysieke onderdelen naar het structureren van data is niet groot. Net als Lego kunnen data-elementen op verschillende manieren worden geordend, afhankelijk van de inhoud, de context of het doel. Dit biedt meerdere ‘views’, manieren om naar dezelfde data te kijken. Een voorbeeld: je kunt de rode steentjes afzonderlijk bekijken of ze ordenen binnen een specifieke vormcategorie, zoals ‘viertjes’, of eigenschap zoals ‘doorzichtig’. Dit principe is ook toepasbaar op datasets.

Verschillende perspectieven: views op data

In Systems Engineering zijn er meerdere ‘views’ op een product mogelijk. Elk van deze views benadrukt een andere gebruikscontext, wat cruciaal is bij het ontwerpen van complexe systemen. Neem een auto als voorbeeld. Je kunt kijken naar:

  1. De functionele view: Welke functies moet de auto vervullen?
  2. De systeemview: Welke subsystemen (zoals de motor of transmissie) realiseren die functies?
  3. De product- of constructieview: Welke onderdelen — vergelijkbaar met de Lego-onderdelen — vormen het eindproduct?
  4. De productieview: Hoe worden de onderdelen geproduceerd en het product samengesteld?
  5. De onderhoudsview: Hoe onderhoud je het product tijdens de levenscyclus?
  6. De hergebruiksview: Hoe kunnen we het product demonteren, recyclen en hergebruiken? 

Elk data-element in het totale digitaal datamodel moet op al deze niveaus vanuit deze views herkenbaar en bruikbaar zijn. De uitdaging is om, net als bij Lego, de losse data onderdelen zo te organiseren dat ze eenvoudig in verschillende structuren kunnen worden hergebruikt.

Van data naar digitale informatieproducten

De digitalisering heeft data tot bouwstenen gemaakt van zogenaamde ‘informatieproducten’. Denk aan een inkooporder, een vergunning, een uitkering, of zelfs een heel ERP-systeem. Deze producten worden opgebouwd door datasets te ordenen en hergebruiken, zoals je met Lego steentjes doet.

Hier komt het concept van het federatief datastelsel in beeld: een systeem waarmee overheidsinstanties data kunnen beheren en hergebruiken over verschillende sectoren heen. Net zoals je met Lego steeds nieuwe creaties kunt bouwen, kun je met een federatief datastelsel bestaande data combineren tot nieuwe informatieproducten.

Een belangrijk uitgangspunt daarbij is dat data slechts één keer wordt vastgelegd en vervolgens beschikbaar wordt gesteld voor meerdere toepassingen. Dit voorkomt duplicatie en garandeert consistentie. 

Masterdata en bronarchivering

Met de komst van digitale productdata in de jaren tachtig — zoals die in de luchtvaartindustrie — werd al snel duidelijk dat er één ‘master’ moest zijn. Onbeheerde kopieën van data leiden namelijk tot chaos. Productdata en Masterdata Management ontstonden om dit te organiseren: één centrale bron van waarheid die door iedereen wordt gebruikt. Cruciaal hierbij is bronarchivering: data wordt ‘versiebeheerd’ vrijgegeven c.q gearchiveerd en vervolgens de hele verdere lifecycle op een gestandaardiseerde manier en op basis van afgesproken bewaartermijnen, opgeslagen en op metadataniveau beheerd.

ArQiver speelt in op lessen uit crises zoals de toeslagenaffaire, waarin gebrekkig datamanagement en het niet digitaal kunnen delen van data, leidden tot grote problemen. Geïnspireerd door deze lessen, richt het zich op het creëren van een gedeeld informatiemodel waarmee organisaties, over processen en applicaties heen, hun data effectief kunnen beheren en hergebruiken. Dit maakt het mogelijk om data niet alleen te gebruiken voor het originele doel, maar ook voor nieuwe toepassingen — net zoals Lego-steentjes telkens opnieuw kunnen worden ingezet. Daarnaast blijven de data gedurende hun hele levenscyclus inzichtelijk voor iedereen die daar gebruik van wil maken. Een basisvoorwaarde voor een ‘Open Overheid’ die georganiseerd inzicht in alle ‘vrijgegeven’ documenten wil en moet geven. Eventueel met parallel vrijgegeven ‘geanonimiseerde’ kopieën.  

De kracht van hergebruik

Het federatieve datastelsel van de overheid belooft dat data niet meer eenmalig wordt gebruikt, maar een leven lang mee kan in verschillende toepassingen. Het hergebruik van data is niet alleen efficiënt, maar ook duurzaam. Met de juiste structuur — zoals bronarchivering en metadata — kunnen we databeleid implementeren dat zowel toekomstbestendig als flexibel is. En optimaliseren in het bewaren (archief) en weggooien (recht om te worden vergeten) van data en informatie-producten. 

Net zoals Lego ons leert hoe simpele bouwstenen tot complexe structuren kunnen leiden, toont een federatief datastelsel hoe we data kunnen organiseren tot waardevolle informatieproducten. Dit vraagt om visie, maar vooral om de bereidheid om onze datastromen net zo zorgvuldig te ordenen als onze bak met Lego. Het succes van een federatief datastelsel hangt af van onze bereidheid om data slim en duurzaam te organiseren. Het is tijd om deze visie in de praktijk te brengen. ArQiver maakt het mogelijk om bronarchivering en metadata management naadloos in bestaande systemen te integreren. Het federatieve datastelsel biedt daarmee een toekomstbestendige oplossing voor duurzaam datagebruik.

Photo by Omar Flores on Unsplash

————————-  Translated with ChatGPT ———————-

Lego Bricks and a Federated Data Framework

Almost everyone has played with Lego at some point: those colorful, interlocking bricks that allow you to build anything from a simple house to a complex robot. Lego originated as wooden toys in the workshop of Ole Kirk Christiansen in Denmark. The name is an abbreviation of the Danish phrase “leg godt” (“play well”), and since 1947, it has been available in the iconic plastic version. What makes Lego special is that every brick, regardless of shape or color, can contribute to a greater whole — whether it’s a castle, a car, or an airplane. It offers endless possibilities for creativity.
But Lego offers us more than just fun. It beautifully illustrates how complex structures can be built from simple components — a concept we can also apply to data and information management.

The Power of Classification
When playing with Lego, many people sort the bricks: the “fours” with the “fours,” the red bricks separate from the blue ones. This classification makes building easier. This principle of organizing and structuring is widely applied in industry, such as in group technology — a methodology developed by TNO to structure and optimize production processes. This can be seen as a kind of “federated component framework,” bringing together and organizing different groups of components based on specific properties.

The step from classifying physical components to structuring data is a small one. Just like Lego, data elements can be organized in various ways, depending on their content, context, or purpose. This offers multiple “views” — ways to look at the same data. For instance, you can view red bricks individually or group them by a specific shape category, such as “fours.” This principle is equally applicable to datasets.

Different Perspectives: Views on Data
In Systems Engineering, multiple “views” of a product are possible. Each of these views highlights a different context of use, which is crucial when designing complex systems. Take a car, for example. You can consider:

  • The functional view: What functions should the car fulfill?
  • The system view: Which subsystems (such as the engine or transmission) deliver those functions?
  • The product or construction view: Which parts — similar to Lego components — form the end product?
  • The production view: How are the components manufactured and assembled?
  • The maintenance view: How do you maintain the product during its lifecycle?
  • The reuse view: How can the product be disassembled and recycled?

Every data element in the overall digital data model must be recognizable and usable at all these levels across these views. The challenge is to organize individual data components so they can be easily reused in various structures — just like Lego bricks.

From Data to Digital Information Products
Digitization has turned data into building blocks for so-called “information products.” Think of a purchase order, a permit, a subsidy, or even an entire ERP system. These products are created by organizing and reusing datasets, much like building with Lego bricks.

This is where the concept of a federated data framework comes into play: a system that allows government agencies to manage and reuse data across various sectors. Just as you can create new designs with Lego, a federated data framework enables the combination of existing data into new information products.

A key principle here is that data is captured only once and then made available for multiple applications. This prevents duplication and ensures consistency.

Master Data and Source Archiving
With the advent of digital product data in the 1980s — such as in the aviation industry — it quickly became clear that there needed to be one “master.” Uncontrolled copies of data lead to chaos. Product Data Management (PDM) and Master Data Management (MDM) emerged to organize this: one central source of truth used by everyone. A crucial element here is source archiving: data is released under version control and then stored for the entire lifecycle in a standardized way, managed at the metadata level.

Lessons from Crises
ArQiver builds on lessons from crises like the Dutch childcare benefits scandal (Toeslagenaffaire), where poor data management and the inability to share data digitally led to significant problems. Inspired by these lessons, ArQiver focuses on creating a shared information model that enables organizations to manage and reuse their data effectively across processes and applications. This makes it possible to use data not only for its original purpose but also for new applications — much like Lego bricks can be reused repeatedly. Additionally, data remains accessible throughout its entire lifecycle for everyone who needs it. This is a fundamental requirement for an “Open Government” that aims to provide organized access to all “released” documents, potentially with parallel “anonymized” versions.

The Power of Reuse
The government’s federated data framework promises that data will no longer be used just once but can serve multiple purposes throughout its lifecycle. Reusing data is not only efficient but also sustainable. With the right structure — such as source archiving and metadata — we can implement data policies that are both future-proof and flexible, optimizing both data retention (archives) and deletion (the right to be forgotten).

Just as Lego teaches us how simple building blocks can lead to complex structures, a federated data framework demonstrates how we can organize data into valuable information products. This requires vision but, above all, the willingness to organize our data flows as carefully as we do our Lego collections. The success of a federated data framework depends on our ability to manage data smartly and sustainably. It’s time to bring this vision to life. ArQiver is now ready and available to realize source archiving and metadata management across existing systems. The federated data framework thus provides a future-proof solution for sustainable data use.