Archiveren en het data-continuüm

Archiveren wordt vaak beschouwd als laatste stap in een lifecycle: ‘voor eeuwig’ opgeborgen. Maar in een volledig digitale wereld kan een gearchiveerd document makkelijk decennia of zelfs langer in gebruik blijven. Het idee van een groeiend data-continuüm (transforming data into wishdom) is een holistische benadering over een consistent en samenhangend regime van beheerprocessen, vanaf creatie tot eeuwig durend gebruik. De theorie van het ‘continuüm-model’ beschrijft vier dimensies – creëren, vastleggen, organiseren en pluraliseren – en vier assen: ‘wie’ deed ‘wat’, ‘welk bewijs’ bestaat hierover en ‘hoe’ kan dit worden teruggehaald uit documenten en archieven. Een nieuwe kijk op record-, document- en content-management. De levenscyclus van data en informatie heeft geen einde meer maar is de-facto eeuwigdurend. 

Geborgde informatie

De theorie wordt ook wel het ‘record continuüm’ genoemd, zie ook mijn blog ‘De databloem’. Het begrip ‘record’ betekent aantekening, vermelding of (officieel) document. Maar ook dossier, een collectie van data of archiefstuk. Het is vooral iets dat een bewijsstuk over het verleden vormt, een verslag dat op schrift of in een andere permanente vorm wordt gehouden. In de huidige wereld, met fakenews, deepfakes en ‘ongemerkte’ verandering van digitale content, wordt de kwaliteit van permanente vastlegging van het origineel steeds belangrijker. Hoe zekerder men weet dat de juiste versie correct en juist is vastgelegd, hoe geloofwaardiger informatie is. De ‘echte’ versie van informatie, hoe deze ooit is gemaakt en was bedoeld. Niet datgene wat anderen daarvan begrepen, overnamen of zelfs veranderden tijdens het gebruik. 

Het continuümmodel is alleen geldig als die permanente vastlegging – het liefst zo dicht mogelijk bij de bron – bewezen heeft plaatsgevonden. Alleen dan heb je een stevig fundament waarop je een consistent en samenhangend regime van beheerprocessen kunt realiseren. Vanaf het directe moment dat informatie wordt aangemaakt, moet dus al duidelijk zijn hoe deze mag en/of moet worden bewaard en gebruikt. Onafhankelijk van de applicatie of het systeem om die informatie of content te genereren en te gebruiken. Het traditionele archiefbeheerdomein zal veel eerder in de lifecycle, actief moeten worden. Archiveren bij de bron wordt steeds belangrijker. Het liefst ook nog via hashing en timestamping, zie een eerdere blogs hierover zoals ‘Blockchain in business’ en  Blockchain als onuitwisbare inkt’.   

Het continuümmodel

Het continuümmodel, ontwikkeld in Australië, is een ‘holistische’ benadering van het begrip archiveren.  Het is ‘… een consistent en samenhangend regime van beheerprocessen vanaf het moment dat documenten worden aangemaakt, door het bewaren en gebruiken van documenten als archieven.’ Op deze wijze wordt archiveren zelfs het bronsysteem om digitale documenten eenduidig te classificeren, te beoordelen, te controleren en te onderhouden. Het model betoogt dat deze processen in de digitale wereld, zo met elkaar verbonden, overlappend en geïntegreerd zijn, dat het contraproductief is om nog enig onderscheid te handhaven.

De theorie van het continuümmodel gaat uit van op registratie gebaseerde activiteiten als een voortdurende beweging in en door vier dimensies en vier assen. De assen vertegenwoordigen de algemene elementen voor het aantonen van verantwoording: wie [identiteit] deed wat [transactionaliteit], welk bewijs hierover bestaat [evidentialiteit], en hoe dit kan worden teruggehaald uit documenten en archieven [gegevensopslag/containers]. Deze elementen vertegenwoordigen de algemene elementen voor het aantonen van verantwoording.

Continuüm versus levenscyclus

De levenscyclusbenadering beschouwt elke fase als lineair met en onafhankelijk van andere fasen. Terwijl in het continuümmodel het bijhouden van gegevens als een multidimensionaal proces wordt gezien. Het suggereert dat het beheer van documenten niet tijdsgebaseerd of opeenvolgend is. Echter datamanagement is vergelijkbaar met assetmanagement en acties met betrekking tot de documenten kunnen gelijktijdig plaatsvinden: een document kan tegelijkertijd worden benaderd voor actuele organisatorische als archiveringsdoeleinden, vooral als het in elektronische vorm beschikbaar is. Het is nuttig bewust te zijn van de aanwezigheid van dit continuüm. Zeker om het begrip van documentatie en archieven en de acties die daaromheen worden uitgevoerd, te vergroten.

Uitgangspunt van de theorie is dat als veel mensen tegelijkertijd gegevens gebruiken en (zelf) bijhouden, het in de loop van de tijd voor meerdere doeleinden wordt overgedragen (Pearce-Moses, 2005). Deze aanpak betekent dat een archiefstuk in wezen actief blijft en in de loop van de tijd zelfs groeiende bewijskracht en historische waarde bezit. Het concept stelt ons in staat archiefbewaarders te zien als bijdragers aan een voortdurend intellectueel proces dat wordt toegepast op de archiefstukken binnen de organisatie. Op die wijze wordt iedereen in een organisatie tot op zekere hoogte archiefbeheerder en moet de verantwoordelijkheid nemen voor de gezondheid van de archiefdocumenten die zij creëren, gebruiken, delen en bewaren.

Creëer, verifieer, archiveer en gebruik

Het idee van het data-continuüm verbindt het einde van een lifecycle weer met zijn begin. Of het begin van één of meer andere lifecycles. Net als de cirkel ‘plan-do-check-act’ een continue werkvolgorde waarmee je telkens, opeenvolgend of als in een spiraal, een hoger niveau bereikt. Net zoals de stelling ‘met geld kun je geld maken’, kun je stellen dat je met data (nieuwe) data kunt maken. Elke nieuwe informatie, in de vorm van een betekenisvolle dataset, kan de bron zijn voor nieuwe informatie. Maar ook een referentie of een bewijs zijn voor andere informatie. Als een stamboom met blijvende voorouders zich opsplitst in steeds verdere vertakkingen, sommige zonder nakomelingen lopen dood maar andere kunnen eeuwig voortgaan. 

Als we document- of contentmanagement zien als lifecycle management van één enkele cycle, dan kun je archiefmanagement zien als lifecycles ‘opgerold’ in een data-continuüm. Net als de PDCA cirkel nu als een cirkel met ‘Creëer, Verifieer, Archiveer en Gebruik’. In feite de basis van configuratie en toepassingsbeheer bij producten (work, verify, release, use). Uit elk onderdeel kan óf een aangepast onderdeel voortkomen óf het kan in een andere samenstelling worden gebruikt. De huidige tijd van ‘hergebruik’ laat onderdelen zelfs een tweede of derde leven krijgen. Daarom is het steeds belangrijker de broninformatie over die eerste creatie te hebben. Dat is te garanderen door te archiveren bij de bron als onderdeel van datacentrisch werken.

Archiveren bij de bron

In eerder blogs heb ik het digitaal archiveren bij de bron al als een verrassende paradigma verandering beschreven in het huidige veld van de vele document- en contentmanagement systemen. Ieder gericht op zijn eigen werkgebied en ingericht om zelfstandige en eenmalige lifecycles te managen. Gebaseerd op de idee die we jaren tachtig en negentig hadden met een digitaliserende mindset: bestaande, losstaande processen digitaal maken. In plaats van het proces integraal in te richten ómdat je in een werkelijk digitale omgeving nu eenmaal totaal anders kunt en moet werken. Dat leidde tot het begrip van datacentrisch werken, echter met in het achterhoofd dat dan ook alles, ook proces, werkwijzen en architectuur op die volledig digitale omgeving is ingericht. We zitten nu in de overgangsfase van deels digitaal naar volledig digitaal. Bij volledig digitaal hoort digitaal archiveren bij de bron ook bij. 

Photo by Masood Aslami

———————-  Translated by ChatGPT    ————————-

Archiving in a Digital Continuum:
A New Perspective

Archiving Reimagined

Archiving is often seen as the final step in a lifecycle, where documents are stored “forever.” However, in a fully digital world, an archived document can remain in use for decades or even longer. The concept of a growing data continuum involves a holistic approach to managing data from creation to perpetual use. This idea integrates four dimensions—creating, capturing, organizing, and pluralizing—and four axes: who did what, what evidence exists, and how it can be retrieved from documents and archives. This new perspective transforms records, documents, and content management into an ongoing process.

Secured Information

Referred to as the “record continuum,” this theory emphasizes the importance of securely recording the original version of documents to ensure credibility. In a world with fake news and deepfakes, the quality of permanent documentation is crucial. Authentic records provide reliable evidence of the past and help maintain the integrity of information.

The continuum model is valid only if the permanent recording happens as close to the source as possible. This establishes a solid foundation for consistent and coherent management processes. From the moment information is created, it should be clear how it should be stored and used, independent of the application or system generating it. Archiving at the source, possibly using hashing and timestamping, is increasingly important.

The Continuum Model

Developed in Australia, the continuum model offers a holistic approach to archiving, integrating management processes from document creation to preservation and use. It suggests that in a digital world, these processes are interconnected and overlapping. This approach contrasts with the lifecycle model, where each phase is seen as linear and independent.

The continuum model is based on the continuous movement through four dimensions and axes, representing accountability elements: identity, transactionality, evidentiality, and data storage. It views record-keeping as a multidimensional process where documents can be used simultaneously for organizational and archival purposes.

Continuum vs. Lifecycle

The lifecycle approach views each phase as independent, while the continuum model sees record-keeping as a multidimensional, ongoing process. This approach aligns with asset management, where actions can occur simultaneously. Documents remain active and can grow in evidentiary and historical value over time, making everyone in an organization responsible for the health of the records they create and use.

Create, Verify, Archive, and Use

The data continuum concept connects the end of a lifecycle back to its beginning, akin to the plan-do-check-act cycle. Each new piece of information can serve as the source for new data, acting as a reference or evidence for other information. This ongoing process ensures that archived information remains relevant and useful over time.

Archiving at the Source

Digital archiving at the source represents a paradigm shift in document and content management systems. Moving from isolated processes to an integrated digital environment, this approach emphasizes data-centric work where all processes and architecture are designed for a fully digital setting. In this transition from partially to fully digital, source archiving becomes essential.

Conclusion

The continuum model offers a holistic and integrated approach to digital archiving, emphasizing the importance of secure, permanent recording close to the source. This method ensures that information remains credible, useful, and relevant over time, supporting the evolving needs of digital information management.

For more detailed discussions and case studies, readers are encouraged to explore the original articles available at Hans Timmerman’s Blog.