Content zonder context heeft weinig waarde.

27 maart 2024

|In Artificial Intelligence, Master Data Management, Data ownership, Digitalisation

Informatie heeft altijd een bron en reden van ontstaan. Iemand schrijft iets op, een sensor meet een waarde, een kompas wijst een richting aan, een gebeurtenis wordt vastgelegd. Elke informatie heeft altijd context die zowel het ontstaan als gebruik nader inhoud geeft. Contextuele informatie is ‘informatie over de informatie’, net zoals metadata data van de data is. Content is het feitelijke bericht maar context is de achtergrond waarin en waarbinnen dat bericht moet worden geplaatst. Het gebruik van kunstmatige intelligentie maakt context management belangrijker. Voor AI- en ML-modellen is contextuele informatie van cruciaal belang om de juiste antwoorden te kunnen genereren. Contextueel begrip is nodig voor het identificeren van objectrelaties en het ondubbelzinnig maken van semantische betekenissen. Daarom wordt momenteel contextuele informatie steeds belangrijker.

Context-aware

Vroeger was de context waarbinnen men systemen gebruikte, sterk bepaald door de fysieke plaats waar de computer stond. Dat veranderde met de komst van de mobiele devices. Hoe kan de mobiliteit voor de gebruiker transparant zijn opdat hij overal automatisch dezelfde dienst kan gebruiken? Transparant in de betekenis dat de gebruiker zich geen zorgen hoeft te maken als er veranderingen in de omgeving optreden. Voor deze transparantie moet het device ‘context aware’ zijn. Bewust van zijn omgeving en het gebruik op dat moment. Denk aan een tablet die bij kanteling de oriëntatie van het scherm verandert, kaarten die zich oriënteren op de huidige lokatie, het zoomniveau aanpassen aan de huidige snelheid of de achtergrondverlichting van de telefoon inschakelen bij gebruik in het donker.

Context verwijst naar de omstandigheden of situatie rond de communicatie die de betekenis of interpretatie beïnvloedt. De inhoud van een gesprek is waar we over praten. De context is waarom we erover praten. Inhoud kan van alles zijn: onze vakantie volgende week, het laatste politieke nieuws, hoe we deze maand onze quota kunnen halen, waarom een voorstel te laat is ingediend, enz. In elk geval is inhoud het ‘wat’ van wat we willen. Waar we het over hebben. Content, de inhoudelijke informatie van een bericht, verwijst naar de daadwerkelijke woorden of informatie die we met de computer eenduidig kunnen registreren, vastleggen en beheren.

Het waarom versus het wat en hoe

Content management is gericht is op het beheer van berichten, documenten, files en tekeningen. De vastlegging van het hoe en wat van een product, een proces of een situatie. Filemanagement en document management bestonden al toen alles nog papier was. Ook archiveren is een vorm van content management: wat moet je bewaren en wat mag je – soms moet je – weggooien. In de jaren tachtig ontstonden de eerste digitale applicaties om documenten te beheren. Als oorspronkelijk papieren dossier of als digitaal object. Een project eind jaren tachtig waarbij we digitaal tekeninginformatie gingen beheren, heette TBE: Tekening Blad Eén. Het digitaliseren van het eerste blad van een set tekeningen waar van oudsher de metadata en de reden van het ontstaan was vermeld. Het waarom, de context van die tekening.

Gekoppeld aan TBE was het project EDC: Engineering Document/Data Control, het beheer van de CAD-modellen waar de inhoud van die tekeningen digitaal was vastgelegd. Het hoe en wat van die set tekeningen. De combinatie van context en content. Metadata en inhoud. TBE legde de context vast: waar en op welke wijze de tekeninginformatie binnen een vliegtuig van belang was. De geldigheid van een onderdeel: voor welke toestellen werd het gebruikt. En omgekeerd de toepassing: waar kon en mocht dat onderdeel of document worden gebruikt. Militair of civiel. Basisonderdeel of klanteneis. Met EDC werd de inhoudelijke ontwerp data (CAD) en productiedata (CAM) vastgelegd die betrekking hadden op die onderdelen of samenstellingen zoals maatvoering, materiaal, bewerking, montage en gebruiksinstructies.

Structuren en lagen

De kern van content management is de mogelijkheid om documenten in onderliggende lagen en structuren te kunnen (blijven) beheren. Bij complexe producten kan zo’n structuur wel tien tot zelfs twintig lagen diep zijn. De uitdaging is om bij veranderingen alle bovenliggende samenstellingen met de juiste versies gekoppeld te houden. Als een enkel onderdeel met de tekening en de bijbehorende beschrijving in een samenstelling verandert, ontstaan al twee verschillende versies van het hoofddocument. Hoe breder en hoe dieper een samenstelling is opgebouwd, hoe complexer het versiebeheer van de documenten wordt. Bij een miljoen onderdelen, wat een groter kapitaalgoed al snel heeft, wordt dat al snel gecompliceerd.

Juist die gecompliceerdheid is digitaal prima te beheren. Immers digitaal grote ‘bomen’ van onderliggende relaties en versies beheren, is wel gecompliceerd maar wel relatief ‘straight forward’. Zeker voor een rechtlijnig denkende computer. In een blog over systeemdenken, beschreef ik al dat iets gecompliceerd kan zijn, zonder dat het complex is. Een recept van een ingewikkeld gerecht kan gecompliceerd zijn, maar als dezelfde stappen worden doorlopen, zal de uitkomst altijd hetzelfde zijn. Dat is bij configuratiemanagement ook: de logica om de onderliggende entiteiten te ordenen en te beheren is helder en eenduidig. Maar wel groot, uitgebreid en daarom voor de mens al snel (te) complex en onoverzichtelijk.

Content Management en de vastlegging van context

In de jaren tachtig werden de eerste content management applicaties ontwikkeld om de groeiende hoeveelheid ‘content’ op ordentelijke manier te ordenen en te beheren. Van eenvoudig filemanagement tot complexe productsamenstellingen. Je heb twee soorten documentbeheer: heel veel, relatief kleine en eenvoudige documenten of juist een beperkt, zeer complexe en ‘diepe’ documenten. Je kunt hier een beetje de tachtig-twintig regel aanhouden. Tachtig procent van alle documenten en files is relatief eenvoudig te beheren, hoewel het er wel heel veel kunnen zijn zoals in administratieve en financiële omgevingen. Twintig procent van de documenten is veel ingewikkelder opgebouwd zoals in engineeringsomgevingen voor complexe producten die vaak ook nog decennialang moeten kunnen worden onderhouden en beheerd.

De laatste tijd komt er een beheersuitdaging bij: het in data-spaces vastleggen van de context die bij de content hoort. In engineeringstoepassingen was de context al vaak relevant en dus beschreven in de productvastlegging. Maar we zien vooral in de ‘eenvoudiger’ administratieve content vastlegging, dat context aanvulling tot uitdagingen leidt. Hoe kun je van grote aantallen relatief kleine entiteiten – eenvoudige files – de groeiende hoeveelheid context toevoegen? Zeker als je met AI-gereedschappen op intelligente wijze van die content en files gebruik wilt gaan maken. Immers, AI-modellen hebben voldoende context nodig om tot de juiste uitkomsten te komen. Juist hier geldt dat content zonder context lastig tot meerwaarde zal leiden. Zeker als je diep en onderling gerelateerd wilt zoeken in die grote aantallen ‘domme’ files. Zeker die context data achteraf toevoegen, is haast onmogelijk.

AI en content management

AI-enabled content management is een interessante nieuwe ontwikkeling. Een belangrijk aspect hierbij is de mogelijkheid van personalisatie van content voor eigen gebruik. Toegang tot content van derden en de orkestratie van die ‘gevonden’ content voor eigen gebruik is een enorme uitdaging. In mijn blog ‘AI als jazzmuzikant’ beschreef ik hoe AI de gebruiker de mogelijkheid geeft te ‘improviseren’ met de content die hij of zij ter beschikking heeft of krijgt. In een andere blog ‘Dematerialisatie: essentie van de metaverse’ gaat over hoe de Metaverse een massaal schaalbaar, interoperabel netwerk is van virtuele real-time werelden die we vanuit de fysieke wereld en de daar aanwezige data moeten beleven. Met ieder een ‘individueel gevoel van aanwezigheid’ zoals identiteit, geschiedenis, rechten, objecten, communicatie en betalingen. De échte uitdaging is dit virtuele leven net zo betrouwbaar, betrouwbaar en veilig te maken als dat in ons fysieke leven is georganiseerd. Waarbij we alle beschikbare data kunnen gebruiken van de wereld waar we op dat moment zijn, fysiek of virtueel. Dat kan alleen als we inhoudelijke data in de op dat moment passende context kunnen plaatsen en gebruiken.

Photo by Aaron Jones on Unsplash

———————- Translated with ChatGPT —————————

Content without context has little value.

Information always has a source and a reason for its existence. Someone writes something down, a sensor measures a value, a compass points a direction, an event is recorded. Every piece of information always has context, which gives further meaning to both its origin and its use. Contextual information is ‘information about the information’, much like metadata is data about the data. Content is the factual message, but context is the background within which that message must be placed and understood. The use of artificial intelligence makes context management more important. For AI and ML models, contextual information is crucial to generate accurate answers. Contextual understanding is necessary for identifying object relationships and disambiguating semantic meanings.

Context-aware

In the past, the context in which systems were used was strongly determined by the physical location of the computers. This only changed with the advent of the mobile phone. How could mobility for the user be transparent so that they could automatically use the same service everywhere? Transparent in the sense that the user didn’t have to worry if changes occurred in the environment. For this transparency, the phone had to be ‘context-aware’. Aware of its surroundings and usage at that moment. Think of a tablet that changes the screen orientation when tilted, maps that orient themselves to the current location, adjusting zoom level based on current speed, or turning on the phone’s backlight when used in the dark.

Context refers to the circumstances or situation surrounding communication that influences its meaning or interpretation. The content of a conversation is what we talk about, and the context is why we talk about it. Content can be anything: our upcoming vacation, the latest political news, how to meet our quotas this month, why a proposal was submitted late, etc. In any case, content is the ‘what’ of what we want. What we’re talking about. Content, the substantive information of a message, refers to the actual words or information that we can register, record, and manage unambiguously with the computer.

The why versus the what and how

Content management is thus focused on managing messages, documents, files, and drawings. Capturing the how and what of a product, a process, or a situation. File management and document management existed when everything was still paper. Even archiving is a form of content management: what should you keep and what can you – sometimes must you – throw away? In the 1980s, applications were developed to manage documents digitally. Originally paper-based files or as digital objects. A project in the late 1980s that involved managing digital drawing information was also called DSO: Drawing Sheet One. Digitizing the first sheet of a set of drawings where traditionally the metadata and the context were stated. The why, the context of that drawing.

Linked to DSO was the EDC project: Engineering Document/Data Control, the management of the CAD models where the content of those drawings was digitally recorded. The how and what of that set of drawings. The combination of context and content. Metadata and content. TBE captured the context: where and in what way the drawing information was relevant within an aircraft. The validity of a part: for which aircraft was it used? And conversely, the application: where could and should that part or document be used? Military or civilian. Basic component or customer requirement. With EDC, the substantive design data (CAD) and production data (CAM) were recorded concerning those parts or assemblies such as dimensions, material, processing, assembly, and usage instructions.

Structures and Layers

The essence of content management lies in the ability to continue managing documents in underlying layers and structures. In complex products, such a structure can be ten to even twenty layers deep. The challenge is to keep all higher-level compositions linked to the correct versions when changes occur. When a single component changes within the drawing and its associated description in a composition, two different versions of the main document emerge. The broader and deeper a composition is built, the more complex document version control becomes. With a million components, which a larger capital asset quickly accumulates, this becomes complicated.

Interestingly, this complexity was easily manageable digitally. After all, managing large ’trees’ of underlying relationships and versions digitally is complex but relatively straightforward. Especially for a linear-thinking computer. In a blog about systems thinking, I already described how something can be complicated without being complex. A recipe for a complicated dish can be complicated, but if the same steps are followed, the outcome will always be the same. It’s the same with configuration management: the logic to organize and manage the underlying entities is clear and unambiguous. But it’s large, extensive, and therefore quickly (too) complex and overwhelming for humans.

Content Management and Capturing Context

In the 1980s, content management applications were developed to orderly organize and manage the growing amount of ‘content’. From simple file management to complex product compositions. There are two types of document management: a lot of relatively small and simple documents, or a few, very complex and ‘deep’ documents. You can roughly adhere to the eighty-twenty rule here. Eighty per cent of all documents and files are relatively easy to manage, although there can be a lot of them, such as in administrative and financial environments. Twenty per cent of the documents are much more complexly structured, as in engineering environments for complex products that need to be maintained and managed over decades.

Recently, a new management challenge has emerged: capturing the context associated with the content. In engineering applications, context was often relevant and therefore described in the product documentation. But especially in the ‘simpler’ administrative content management, we see that adding context poses challenges. How can you add the growing amount of context to large numbers of relatively small entities – simple files? Especially when you want to use AI tools intelligently with that content and files. After all, AI models need sufficient context to arrive at the right outcomes. Here, it’s precisely the case that content without context will hardly lead to added value. Especially if you want to search deeply and interrelatedly in those large numbers of ‘dumb’ files.

AI and Content Management

AI-enabled content management is a new development. An important aspect here is also the ability to personalize content for individual use. Access to third-party content and orchestrating that ‘found’ content for individual use is a huge challenge. In my blog ‘AI as a Jazz Musician,’ I described how AI gives users the ability to ‘improvise’ with the content they have or receive. In another blog, ‘Dematerialization: Essence of the Metaverse,’ I discuss how the Metaverse is a massively scalable, interoperable network of real-time virtual worlds that we experience from the physical world and the data present there. Each with an ‘individual sense of presence’ like identity, history, rights, objects, communication, and payments. The real challenge is to make this virtual life as reliable, trustworthy, and secure as it is organized in our physical life. Where we can use all available data from the world we are in at that moment, physically or virtually. This can only be achieved if we can place and use substantive data in the context that is appropriate at that moment.

Hans Timmerman

All author posts

Content zonder context heeft weinig waarde.

Content without context has little value.

Hans Timmerman

Add comment Reactie annuleren