Archiveren: het oudste beroep van de overheid?

Het woord ‘archief‘ is afgeleid van het Griekse archeion, dat overheidsgebouw betekent. De primaire definitie van het woord is ‘een plaats waar registraties en documenten worden bewaard’. Aan deze definitie voegen de meeste moderne woordenboeken de secundaire betekenis toe van ‘optekenen en vastleggen’. Daarom is de stelling dat de archivaris één van de oudste beroepen van de overheid is, niet onzinnig: hij of zij die vastlegt en bewaard. Een dossier of ‘record’ is het boek of schrift waar het verslag in staat en opslag vraagt, waarna  vervolgens actief dossier- en archiefbeheer nodig is en blijft(record and archive management). 

Vastleggen opdat je kunt regeren

De Griekse term verwees naar de woning van de Archon, een heerser of hoofdmagistraat, waar officiële staatsdocumenten werden bewaard en geïnterpreteerd. De betekenis breidde uit tot begrippen als ‘stadhuis’ en ‘openbare registers’. Het Griekse woord is ἀρχή (arkhē) betekent ‘magistratuur, ambt, regering’ en is afgeleid van het werkwoord ἄρχω (arkhō), wat ‘beginnen, regelen, regeren’ betekent. Het woord architect komt, in combinatie met τέκτων (tektōn) in de betekenis van hoofd-ambachtsman, bouwer of timmerman, hier ook uit voort. Immers, om effectief te bouwen of te besturen, moet je niet alleen kunnen organiseren maar ook kunnen vastleggen én bewaren.

Optekenen – to record – betekent iets vastleggen of bewaren op een manier die er permanent bewijs van bevat. Het woord ‘record’ wordt ook gebruikt om te verwijzen naar het schrift of document dat het bewaarde verslag staat. Het woord archive (archief) werd voor het eerst in het Engels aangetroffen in het begin van de 17e eeuw en het woord archivaris in het midden van de 18e eeuw. Beide termen werden in eerste instantie gebruikt met betrekking tot buitenlandse instellingen en personeel. Aan het einde van de 19e eeuw werden ze op steeds grotere schaal ook gebruikt in de binnenlandse bestuurlijke context.

Het woord archief 

De oudst bewaarde archieven zijn kleitabletten, waarin tekst is gegraveerd. Er zijn niet veel echt oude archieven omdat de meeste documenten waarmee zij waren gemaakt, zijn vergaan. In onze westerse wereld zijn de eerste archieven ontstaan in de Middeleeuwen (500 – 1500) bij de adel en in kerken en steden. Het woord archief (archive/archives) om de plaats aan te geven waar documenten worden bewaard, is overeenkomstig in Engels, Frans, Nederlands, Spaans, Duits, Italiaans, Zweeds, Pools, Russisch en nog diverse andere landen. In Amerika is het begrip vaak gekoppeld met bibliotheek (“libraries and archives”).

Vele woorden rond archiveren zoals bijvoorbeeld in het Duits – archiv, archivale, archivalien en archivalische – zijn in het Engels allemaal vertaald met het ene woord ‘archives’. ‘Archivale’ is de kleinste individuele eenheid van archiefmateriaal en  archivgut’ is de verzameling van alle documenten – met name van overheidsinstanties – die geschikt wordt geacht voor archivering. Het Spaanse ‘archivologia’ is afgeleid van de Griekse woorden archeion en logos. Het omvat zowel de theorie als praktijk in de betekenis van (a) plaatsen waar documenten worden bewaard, (b) de documenten zelf en (c) die op die plaats worden gebruikt.

Direct onveranderlijk vastleggen

De kern van archiveren is onveranderlijk vastleggen. In de tijd dat kleitabletten of papier de informatiedragers waren, werd die betreffende informatiedrager ‘uiteindelijk’, aan het einde van de gebruiks- of levenscyclus, gearchiveerd. Digitalisering van informatie heeft informatie losgekoppeld van de de drager van die informatie. Van het masterdocument kan makkelijk een digitale werkkopie worden gemaakt, terwijl ‘de digitale master’ veilig en beheerd bleef opgeslagen. Omdat documenten na verzenden/publicatie nooit meer veranderen en ook geen informatiedrager voor de gebruikers meer zijn, kunnen digitale documenten en berichten veel eerder worden gearchiveerd dan in de oude papieren periode. 

Eigenlijk zijn ze op het moment van formele publicatie onveranderlijk geworden en kunnen (dus!) direct worden gearchiveerd. Nieuwe versies of reacties op het origineel zijn immers elk weer als digitaal document of bericht direct archiveerbaar. Dit paradigma verandert het totale beeld van het archiveren: in plaats van aan het einde van de gebruiksperiode, moet nu juist aan het begin archivering plaatsvinden. Het wordt de bron van document- en berichtstromen in plaats van het eindpunt. Dat stelt hele andere eisen aan efficiency en doorlooptijd van het proces. Hoe sneller en automatischer digitale informatie onveranderlijk kan worden vastgelegd, met de juiste labeling, de juiste relaties en actuele context over het ontstaan, des te waardevoller het archief wordt voor de toekomst. 

Archiveren wordt steeds belangrijker

Nieuwe wetgeving op het gebied van privacy en het bewaren van gegevens is de laatste jaren flink strenger geworden. Onze nieuwe archiefwet omvat meer gegevenstypen die moeten worden gearchiveerd. Behalve de ‘bekende’ bestuurlijke documenten en het mailverkeer nu ook wat via sociale media wordt gecommuniceerd zoals sms-berichten, instant messaging-apps, chatplatforms. Dit vraagt gezien de hoeveelheid, vergaande automatisering en het gebruik van efficiënte cloudplatformen, AI-gedreven redactie van gevoelige gegevens, vele API-integraties, meerlaagse en zero-trust gebaseerde beveiliging en last-but-no-least geavanceerde zoek- en combinatie algoritmes. 

Het achteraf snel kunnen doorzoeken, vinden en combineren van de exponentieel groeiende hoeveelheid archiefdata wordt steeds belangrijker. De afloop van onze toeslagen-affaire heeft dat voor iedereen duidelijk gemaakt. Deze nieuwe zowel functionele als systeemeisen heeft een groep ondernemende ontwikkelaars twee jaar geleden verleidt tot het ontwikkelen van een moderne archiveringsoplossing als basis voor een nieuwe broninfrastructuur: ArQiver gebouwd om op razendsnelle ‘engines’ aan die nieuwe eisen van performance en flexibiliteit te voldoen en persistentie van datastructuren garanderen. Duizenden relaties snel doorzoeken op keywords, context, verbanden en anomaliën. Direct archiveren heeft als voordeel dat data ook centraal en open toegankelijk beschikbaar is. Niet meer in de stovepipes van applicaties, organisaties en departementen die de basis waren van onze rijks informatie-architectuur. 

Thorbecke 2.0

De grondwet uit 1848 legde de basis voor de informatie-organisatie van onze rijksoverheid. Papieren dossiers werden opgeslagen per departement en verspreid over de drie lagen van Rijk, provincie en gemeente. En zo was ons archiefsysteem ook georganiseerd. Maar in de nieuwe digitale wereld werd dat een steeds grotere beperking die informatietechnisch ook niet meer nodig is. Je kunt artikel 44 van de grondwet veranderen (verantwoordelijkheden van de minister) of via directe archivering data direct open en publiek beschikbaar stellen. 

Directe automatische archivering maakt Thorbecke 2.0 mogelijk: eenmaal gearchiveerd, wordt alle data ‘departement, provincie en gemeente-onafhankelijk’ en voor de burger transparant. Elke burger kan ‘meekijken’ in zijn dossier of dat nu rijks, provincie, waterschap of gemeente informatie is. De burger kent immers maar één overheid die in één view moet kunnen laten zien welke data zij van de burger in beheer heeft. Eigenlijk kan een Wet Open Overheid alleen maar goed functioneren als er op basis van een datacentrische strategie en architectuur, direct en open wordt gearchiveerd.

*) Zie eerdere artikelen uit 2012 hierover als ‘Information Intelligence’, ‘De informatiemaatschappij van 2023’ en ‘De schoonheid van datacentrisch denken’. 

Photo by AXP Photography

—————–  translated by ChatGPT —————

Archiving: The Oldest Profession of the Government?

The word ‘archive’ is derived from the Greek “archeion,” meaning government building. The primary definition of the word is ‘a place where records and documents are kept.’ Most modern dictionaries add the secondary meaning of ‘recording and documenting.’ Therefore, the assertion that the archivist is one of the oldest professions of the government is not far-fetched: he or she who records and preserves. A dossier or ‘record’ is the book or file where the report is kept, necessitating active record and archive management.

Recording to Govern The Greek term referred to the residence of the Archon, a ruler or chief magistrate, where official state documents were stored and interpreted. The meaning extended to concepts like ‘city hall’ and ‘public registers.’ The Greek word ἀρχή (arkhē) means ‘magistracy, office, government’ and is derived from the verb ἄρχω (arkhō), which means ‘to begin, to rule, to govern.’ The word architect also comes from this, in combination with τέκτων (tektōn) meaning master craftsman, builder, or carpenter. To effectively build or govern, one must not only be able to organize but also to record and preserve.

To record means to document or preserve something in a way that provides permanent evidence. The word ‘record’ also refers to the document that contains the preserved report. The word archive first appeared in English in the early 17th century, and the word archivist in the mid-18th century. Both terms were initially used concerning foreign institutions and personnel. By the late 19th century, they were increasingly used in the domestic administrative context.

The Word Archive The oldest preserved archives are clay tablets with engraved text. There are not many truly old archives because most documents from which they were made have perished. In our Western world, the first archives emerged in the Middle Ages (500 – 1500) among the nobility and in churches and cities. The word archive (archive/archives) to denote the place where documents are stored is similar in English, French, Dutch, Spanish, German, Italian, Swedish, Polish, Russian, and many other languages. In America, the term is often paired with library (“libraries and archives”).

Many words related to archiving, such as in German – archiv, archivale, archivalien, and archivalische – are all translated into English with the single word ‘archives.’ ‘Archivale’ is the smallest individual unit of archival material, and ‘archivgut’ is the collection of all documents – particularly from government agencies – deemed suitable for archiving. The Spanish ‘archivologia’ is derived from the Greek words archeion and logos. It encompasses both the theory and practice in the sense of (a) places where documents are stored, (b) the documents themselves, and (c) those used in that place.

Direct Immutable Recording The core of archiving is immutable recording. When clay tablets or paper were the information carriers, the specific information carrier was ‘eventually,’ at the end of its use or life cycle, archived. Digitizing information has decoupled information from its carrier. From the master document, a digital working copy can easily be made, while ‘the digital master’ remains securely and managedly stored. Since documents, after sending/publication, never change and are no longer information carriers for users, digital documents and messages can be archived much earlier than in the old paper period.

Essentially, they become immutable at the moment of formal publication and can (therefore!) be archived immediately. New versions or responses to the original can each be archived directly as a digital document or message. This paradigm changes the entire view of archiving: instead of at the end of the usage period, archiving must now take place at the beginning. It becomes the source of document and message flows instead of the endpoint. This places entirely different demands on the efficiency and throughput of the process. The faster and more automatically digital information can be immutably recorded, with the right labeling, relationships, and current context about its origin, the more valuable the archive becomes for the future.

Archiving Is Becoming More Important New legislation on privacy and data retention has become significantly stricter in recent years. Our new archive law encompasses more types of data that must be archived. Besides the ‘known’ administrative documents and email traffic, it now includes what is communicated via social media such as SMS messages, instant messaging apps, and chat platforms. Given the volume, this requires extensive automation and the use of efficient cloud platforms, AI-driven editing of sensitive data, numerous API integrations, multi-layer and zero-trust-based security, and advanced search and combination algorithms.

The ability to quickly search, find, and combine the exponentially growing amount of archival data is becoming increasingly important. The conclusion of our benefits scandal made this clear to everyone. These new functional and system requirements prompted a group of enterprising developers two years ago to develop a modern archiving solution as the basis for a new source infrastructure: ArQiver, built to meet these new performance and flexibility demands with blazing-fast ‘engines’ and ensuring the persistence of data structures. Quickly searching thousands of relationships for keywords, context, connections, and anomalies. Immediate archiving has the advantage that data is also centrally and openly accessible. No longer in the stovepipes of applications, organizations, and departments that formed the basis of our national information architecture.

Thorbecke 2.0 The constitution of 1848 laid the foundation for the information organization of our national government. Paper files were stored per department and spread across the three levels of national, provincial, and municipal governments. And so, our archive system was also organized. But in the new digital world, this became an increasingly significant limitation, which is no longer technically necessary. You can change article 44 of the constitution (responsibilities of the minister) or make data directly open and publicly available through direct archiving.

Direct automatic archiving makes Thorbecke 2.0 possible: once archived, all data becomes ‘independent of departments, provinces, and municipalities’ and transparent to the citizen. Every citizen can ‘look into’ their file, whether it is national, provincial, water board, or municipal information. After all, the citizen knows only one government that should be able to show in one view what data it manages about the citizen. In fact, an Open Government Act can only function well if it is based on a data-centric strategy and architecture, with direct and open archiving.

*) See previous articles from 2012 on this topic such as ‘Information Intelligence,’ ‘The Information Society of 2023,’ and ‘The Beauty of Data-Centric Thinking’.