Tao, data en de tuinarchitect
Stel dat we – heel filosofisch – data zouden vergelijken met Tao. De Tao als actieve bron waaruit we informatie maken. Data als Tao om uit chaos ordelijke boodschappen te creëren. Voor veel westerlingen is Tao alleen bij benadering te begrijpen. Tao geeft een actieve holistische weergave van de wereld. In tegenstelling tot de westerse metafysische wereld, die statisch en analytisch is opgebouwd. In de opgetekende tekst van Lao Zi: “De essentie van Tao is dat het niet uitgedrukt kan worden.” Tao is het beginsel, de bron, oorzaak of oorsprong van al het bestaande. Het is een cirkelgang en creëert gewenste ordelijke patronen in de chaos. Zoals de natuur uit atomen en moleculen elke keer weer nieuw leven, nieuwe patronen en nieuwe vormen creëert. Zoals we telkens weer nieuwe informatie en kennis creëren uit de intussen oneindige hoeveelheid data die er is.
Bron van het al
Als filosofisch begrip is Tao de alomvattende, uit zichzelf bestaande, oneindige, tijdloze kosmische eenheid. De bron van alles én de bestemming van alles zonder begin en zonder einde. Het benadrukt de fundamentele en werkelijke natuur van de wereld. De magische kracht die maakt dat alles groeit en bloeit. Een mini zaadje ontwikkelt zich en wordt een boom. Planten, bomen en dieren groeien uit zichzelf. We kunnen een plant niet dwingen hier een tak, daar een blaadje en daar een bloem te maken. De natuur laat zich lastig dwingen, zoals we in onze metafysische wereld zo graag willen. De mens die de natuur de baas is.
Maar de natuur laat zich wel leiden en zeker ook verleiden. Een jong plantje kunnen we leiden naar de vorm die we willen of mooi vinden. Ongewenste takken wegsnoeien of te verleiden in de gewenste richting en vorm te groeien. Dat is de basis van Tao: het levende met minimale inspanning de gewenste richting te laten kiezen. Als we dat idee los laten op de groeiende data-hoeveelheid die we met elkaar creëren, liggen interessante mogelijkheden te wachten. In grote big data lakes waar we verschillende soorten data bijeenbrengen, zien we wisselende ‘data-dichtheden’ ontstaan. Net als het oneindige heelal waar we wisselende massa-dichtheden zien in de vorm van miljoenen super nova’s en sterrenstelsels.
Data dichtheden en visualisatie
Er zijn vele technieken om data te visualiseren, om complexe datasets om te zetten in visuele weergaven. De meest bekende zijn grafieken en diagrammen. Maar hoe complexer de datasets worden, hoe lastiger het is data te visualiseren. Het nut van visualisatie is, dat onze menselijke hersenen beelden 60.000 keer sneller verwerken dan tekst. In de neurowetenschap maakt men visuele mappings van verschillende MRI-scans om anomalieën te ontdekken. En te ontdekken waar – mede door datagravity, de aantrekkingskracht van data – de data-dichtheid anders en intensiever is. Juist dat zijn de plaatsen waar iets gebeurt, waar het interessant is en waar wellicht iets nieuws te vinden is. Met een open blik omdat we – net als ons heelal – nooit alles kunnen weten en (over)zien.
‘Exploratory Data Analysis’ (EDA) helpt bij bijvoorbeeld bij kankeronderzoek in het voorspellen van overlevingskansen door patronen van data-dichtheden te ontrafelen, afwijkingen te identificeren en betekenisvolle inzichten te te extraheren. Of MRI’s van verschillende kankersoorten met elkaar te vergelijken en overeenkomsten en verschillen te ontdekken. Het gebruik van verschillende EDA-technieken blijkt van groot belang bij het bereiken van betekenisvolle inzichten die het ontstaan van kanker verhelderen. Ons inzicht in potentiële overlevingskansen vergroten. Op deze wijze staat data ons ter beschikking bij de kern van ons leven: onze gezondheid. En waarbij we ons als Tao volledig openstellen in wat data ons allemaal nog meer kan vertellen.
De tuin als dataverzameling
We hebben de architectuur van levende en dode materie. De architectuur van een gebouw of huishouding is meestal gebaseerd op onze metafysische westerse inzichten. We bouwen een huis en richten het daarbinnen in voor de geplande huishouding. Maar een landschap- of tuinarchitectuur heeft heel andere vertrekpunten. Hoe gaan we levende natuur in een vorm of toepassing krijgen, opdat ze voldoet aan wat we willen? En alle natuur heeft legacy: bestaande gebieden, bossen, grasland en zandvlaktes. Elke landschap- en tuinarchitectuur is eigenlijk altijd een transformatieproces. Hoe verander ik het bestaande in iets nieuws en doelmatigers?
Bij het inrichten van een tuin moet rekening worden gehouden met bestaande bomen, volwassen planten en bodemstructuur. Ook met het gegeven dat een nieuwe boom of struik niet morgen al tot volle wasdom komt. Het eindbeeld van de gewenste architectuur zal zich pas in de loop der jaren ontwikkelen. Met daarbij een plan hoe de natuur die vormen te laten krijgen door te snoeien en te (ver)leiden. Tuinarchitectuur is doorspekt met Taoïsme. In harmonie tot de groeiende, uitdijende natuur uiteindelijk de vorm en inrichting krijgt, die gewenst is. Met liefde leiden, verleiden, gericht snoeien en het gewenste in standhouden.
Taoïstisch data-omgevingen inrichten
Bovenstaande redenering verklaart tevens waarom data-architecturen vaak zo lastig zijn te realiseren. Ze kunnen niet op onze analytische westerse wijze met atomen en moleculen worden gebouwd, maar we moeten ze op een natuurlijke wijze laten groeien tot wat we willen. Dat vraag een ‘oosters tintje’ aan dit vakgebied: begrijpen hoe data groeit, hoe we liefdevol verleiden, soms dwingend leiden en gericht snoeien naar de omgeving die we willen. En het tijd gunnen om tot rijpheid en volwassenheid te komen. Inclusief regelmatig schoffelen en onderhoud om het niet te laten verwilderen. En ongewenst onkruid op tijd verwijderen.
Misschien is het woord ‘datatuin’ wel eens een mooi woord om over data-omgevingen te spreken en de architecten en inrichters te zien als tuinarchitect en tuinman of -vrouw. Het vormen en instandhouden van een levende omgeving, waaruit men de gewenste informatie kan creëren en uitwisselen. Datagroei is dan fijn en iets natuurlijks, want op die wijze kan men het in de meest gewenste vorm laten groeien. Mits men op tijd snoeit, schoffelt en oude takken en bladeren ook inderdaad opruimt. Elke tuin zonder onderhoud verwildert in korte tijd. Een niet onderhouden data-omgeving ook. Data zonder Tao eindigt in chaos.
Organiseren en structureren
In dit wat filosofisch blogje eindig ik natuurlijk, zoals altijd, bij het organiseren en structureren van data-omgevingen. Net als de tuinarchitect paden en vaste vormen creëert waar het geheel zich aan te houden heeft. Een kasplantje mag in eerste instantie vrij groeien, maar zodra deze een vaste plek en toepassing in de datatuin heeft gekregen, moet deze zich aan de geldende richtlijnen aldaar houden. Data – vers uit de kas – wordt eenduidig gearchiveerd en kan vervolgens levenslang door iedereen voor het ooit gewenste doel worden gebruikt.
Je kunt archiveren van data zien als het afsluiten van de initiële groei van een dataproduct dat daarmee formeel vastgelegde en vrijgeven informatie is geworden. Vrijgegeven voor het gewenste gebruik en vrij om zelfstandig verder te groeien. Vrijgegeven omdat het aan kwaliteitscriteria voldeed en de vrije wereld in mag. Vrijgegeven omdat het daarmee voor de toekomst is geborgd. Archiveren is het moment dat een plant, struik of boom de kwekerij kan en mag verlaten. Door een tuinarchitect op de geplande plek en positie kan worden gepland. Daar naar zijn toekomstige volwassenheid groeit. En een knipoog naar een wat meer Taoïstische kijk op datamanagement. Niet alles is maakbaar in dit leven. Soms moeten we het de tijd en de koesterende en liefdevolle verleiding geven om uiteindelijk tot volwassenheid te komen. Waarbij voortdurend snoeien, schoffelen en onkruid verwijderen een must blijft . . . 🙂
Photo by Helena Lopes
——————— Translated by ChatGPT ———————
Tao, data, and the garden architect
Tao provides an active holistic view of the world, in contrast to the Western metaphysical world, which is constructed in a static and analytical manner. Suppose we were to philosophically compare data as the Tao of information technology. An active source from which we create information. Data as Tao to create orderly messages out of chaos. For many Westerners, Tao is only approximately understandable. In the recorded text of Lao Zi: “The essence of Tao is that it cannot be expressed.” Tao is the principle, the source, cause, or origin of all that exists. It is a cyclical process and creates desired orderly patterns in chaos. Just as nature, from atoms and molecules, continuously creates new life, new patterns, and new forms. Similarly, we constantly create new information and knowledge from the meanwhile infinite amount of data that exists.
Source of all
As a philosophical concept, Tao is the all-encompassing, self-existing, infinite, timeless cosmic unity. The source of everything and the destination of everything without beginning and without end. It emphasizes the fundamental and true nature of the world. The magical force that makes everything grow and flourish. A tiny seed develops and becomes a tree. Plants, trees, and animals grow by themselves. We cannot force a plant to make a branch here, a leaf there, and a flower over there. Nature resists being forced, as we so often desire in our metaphysical world. The human who dominates nature.
But nature can be guided and certainly also enticed. We can guide a young plant to the shape we want or find beautiful. Pruning unwanted branches or enticing it to grow in the desired direction and form. That is the basis of Tao: allowing the living to choose the desired direction with minimal effort. If we apply this idea to the growing amount of data we create together, interesting possibilities await. In large big data lakes where we bring together different types of data, varying ‘data densities’ emerge. Just like the infinite universe where we see varying mass densities in the form of millions of supernovas and galaxies.
Data densities and visualization
There are many techniques to visualize data, to convert complex datasets into visual representations. The most well-known are graphs and diagrams. But the more complex the datasets become, the harder it is to visualize data. The benefit of visualization is that our human brains process images 60,000 times faster than text. In neuroscience, visual mappings of different MRI scans are made to discover anomalies. And to discover where – partly due to data gravity, the attraction of data – the data density is different and more intense. These are precisely the places where something happens, where it is interesting, and where perhaps something new can be found. Just like in our universe.
‘Exploratory Data Analysis’ (EDA) helps, for example, in cancer research in predicting survival chances by unraveling patterns of data densities, identifying anomalies, and extracting meaningful insights. Or comparing MRIs of different types of cancer to discover similarities and differences. The use of various EDA techniques, coupled with Python and a panda library, proves crucial in achieving meaningful insights that clarify the emergence of cancer. Enhancing our understanding of potential survival chances. In this way, data is available to us at the core of our lives: our health.
The garden as data collection
We have the architecture of living and dead matter. The architecture of a building or household is usually based on our metaphysical Western insights. We build a house and furnish it inside for the planned household. But landscape or garden architecture has very different starting points. How do we get living nature into a shape or application that meets what we want? And all nature has legacy: existing areas, forests, grasslands, and sand plains. Every landscape and garden architecture is essentially always a transformation process. How do I change the existing into something new and more functional?
When redesigning a garden, existing trees, mature plants, and soil structure must be taken into account. Also, the fact that a new tree or shrub will not reach full maturity tomorrow. The final image of the desired architecture will only develop over the years. Including a plan on how to let nature take those forms by pruning and guiding. Garden architecture is imbued with Taoism. In harmony until the growing, expanding nature eventually gets the shape and arrangement that is desired. With love, guide, entice, selectively prune, and maintain the desired.
Designing Taoist data environments
The above reasoning also explains why data architectures are often so difficult to realize. They cannot be built in our analytical Western way with atoms and molecules, but we must let them grow naturally into what we want. That requires an ‘Eastern touch’ to this field: understanding how data grows, how we lovingly entice, sometimes forcefully guide, and selectively prune to the environment we want. And give it time to mature and ripen. Including regular weeding and maintenance to prevent it from becoming overgrown. And removing unwanted weeds in time.
Perhaps the word ‘data garden’ is a beautiful word to talk about data environments and to see the architects and designers as garden architects and gardeners. Shaping and maintaining a living environment from which one can create and exchange the desired information. Data growth is then pleasant and something natural, because in this way it can grow in the most desired form. Provided one prunes, weeds, and indeed clears old branches and leaves in time. Every garden without maintenance becomes overgrown in a short time. An unmaintained data environment too. Data without Tao ends in chaos.
Organizing and structuring
In this somewhat philosophical blog, I naturally end, as always, with organizing and structuring data environments. Just as the garden architect creates paths and fixed forms that the whole must adhere to. A greenhouse plant may initially grow freely, but once it has a fixed place and application in the data garden, it must adhere to the guidelines there. Data – fresh from the greenhouse – is uniquely archived and can then be used by everyone for the desired purpose for a lifetime.
You can see archiving data as ending the initial growth of a data product that thereby becomes formally established and released information. Released for the desired use and free to grow further independently. Released because it met quality criteria and is allowed into the free world. Released because it is thus secured for the future. Archiving is the moment a plant, shrub, or tree can and may leave the nursery. Planted by a garden architect in the planned place and position. There it grows towards its future maturity. And a nod to a more Taoist view of data management. Not everything is manageable in this life. Sometimes we have to give it time and the nurturing and loving enticement to eventually reach maturity. Where constant pruning, weeding, and removing weeds remain a must…
Conclusion:
Tao presents an active, holistic worldview, contrasting with the static, analytical Western perspective. Philosophically comparing data to Tao, data is seen as an active source creating order from chaos. Nature, through Tao, forms orderly patterns from chaos, similar to continuous data creation. Effective data architectures need an ‘Eastern touch,’ recognizing natural growth, gentle guidance, and timely pruning. This approach transforms data environments into ‘data gardens,’ promoting healthy growth, maintenance, and structured archiving.