“We hebben geen slotgracht . . . “

Hoe Google en OpenAI werden verslagen door OpenSource

Afgelopen weken is er veel gediscussieerd over een ‘gelekte’ mail van een Google-medewerker over de kracht van open source. Dat daar uiteindelijk niet tegen te concurreren valt. De open source community adopteerde vorig jaar het door Meta gepubliceerde OPT-model – het equivalent voor GPT – niet alleen razend snel. Maar verbeterde het ook onverwacht snel. Dat was voor velen in de Big Tech een verrassing: hoe een open community in korte tijd dit complexe OPT-model onder de knie kreeg, verbeterde en actief ging gebruiken. Dit leidde tot de titel van zijn mail en deze blog: Big Tech heeft geen slotgracht meer. Ze kunnen het nooit winnen van open source. De conclusie is: nu AI open source is geworden, valt met AI zelf geen geld meer te verdienen. Slechts met de producten die je rond die AI bouwt. . . . 

Open innovatie kun je niet verbergen

De Big Tech industrie kon groeien omdat zij een gesloten model had rond hun technologie en producten. We mochten op hun cloud en diensten landen, maar die bleven verder een black box voor de gebruiker. Omdat het enorm grote, complexe en dus dure applicaties waren, was het voor individuen onmogelijk deze snel te doorgronden en te gebruiken. Maar de kracht van open source is crowd sourcing. Een ongelimiteerde hoeveelheid ontwikkelkracht die in korte tijd wél die complexe modellen weet te doorgronden. En – belangrijker – in veel kleinere, makkelijker te onderhouden en gebruiken modellen wist op te splitsen.  

Dit maakte AI niet alleen een open product, maar ook veel makkelijker te ontwikkelen en te gebruiken techniek. Iedere ontwikkelaar kan nu de relevante, open delen samenvoegen voor de specifieke toepassing die hij of zij wil hebben. Voor een prijs die minimaal is. Hierdoor hebben grote bedrijven eigenlijk geen voordeel meer van het zelf bezitten van grote AI-modellen, anders dan voor eigen gebruik. De markt zal ze niet duur kopen als ze door anderen goedkoop te maken en leveren zijn. In mijn vorige blog over de ‘Intelligente Assistent’ memoreerde ik dat Sam Altman, CEO van OpenAI, tijdens een recent MIT-evenement al verklaarde dat het tijdperk van gigantische AI-modellen zoals GPT-4 ten einde loopt.

De democratisering van Web3

Eigenlijk gebeurt er momenteel wat de ontwikkelaars van Web3 altijd voor ogen stond. Het imperfecte internet had lange tijd grote spelers nodig om ons te ondersteunen het internet snel en effectief te kunnen gebruiken. Dat maakte hen dominant tot het moment dat het internet ‘zelf’ die diensten kon bieden. Daar heeft blockchain – en nu open AI – enorm aan meegeholpen. Deze ontwikkelingen markeren het einde van de middeleeuwen van het internet. Een renaissance van internet voor iedereen, met alle privacy, veiligheid en peer-to-peer mogelijkheden voor betalen, communiceren en zakendoen. 

Maar ook het einde van het onbeperkt data kunnen aftappen, verzamelen en gebruiken door bedrijven en overheden. De toegang tot gegevens wordt moeilijker en duurder door copyright, privacy, encrypty, geopolitiek, vervuilde data en betaald data-gebruik. We gaan steeds meer de waarde van data zelf zien en inzien. Decentraal internet en nieuwe encryptie-technieken maken het steeds makkelijker onze data en informatie beter te beveiligen. Via quantum secure storage kunnen we het super veilig en in nauwelijks meer te vinden gedistribueerde stukjes opslaan. De speld in de hooiberg die zonder een persoonlijk vind-algoritme zo goed als onvindbaar is. De burger kan weer eigenaar van zijn eigen digitale data zijn; en vooral blijven.   

Datakwaliteit schaalt beter dan datagrootte

Een van de belangrijkste redenen dat open source het uiteindelijk wint van grote gesloten ontwikkelmodellen, is omdat de kwaliteit van data uiteindelijk belangrijker is dan de hoeveelheid data die je hebt. Met kleine modellen kun je de inhoudelijke data snel in vele iteraties kwalitatief verbeteren. Hoe groter het model, hoe lastiger, trager en duurder dat proces wordt. Als een open community een bijna oneindige en goedkope ontwikkelcapaciteit heeft, zal de community het altijd winnen van een grote speler. Niemand betaalt voor een duur beperkt model als er gratis, onbeperkte alternatieven van vergelijkbare kwaliteit zijn. Centrale oplossingen gaan het uiteindelijk afleggen tegen – net zo goede – decentrale oplossingen. 

Dat is de revolutie van Web3 en het einde van de gigantische modellen. Net zoals de Concorde en de 747 het uiteindelijk aflegden tegen kleinere oplossingen. De Concorde was heel snel, maar als product heel duur. De 747 was heel groot maar als product ook heel duur. Grootte en snelheid maakten de producten exponentieel zo veel duurder, dat ze uiteindelijk niet meer concurrerend waren. Alles heeft een optimale grootte en vorm, als je die overschrijdt, is de oplossing niet meer rendabel. In een eerdere blog over de Normalized Systems Theorie beschreef ik al dat de ‘legoblokjes’-aanpak bij software ontwikkeling de weg is om grotere applicaties te bouwen. De techniek van micro services waar de cloud groot mee werd. 

Waarom Open Source wint   

Allereerst is het gratis. Het open karakter van open source maakt bijdragen van iedereen mogelijk, waardoor oplossingen veel sneller kunnen worden opgeschaald. Dat is echter niet alles. Daarnaast is open source diverser.  Grote bedrijven zijn strak georganiseerd en hebben hoog opgeleide ontwerpers. Maar daardoor zijn ze ook inflexibeler en hebben die hoog opgeleiden allemaal dezelfde bias. Dat doodt de echte innovatie. Daar heb je dwarsdenkers, onvermoeibare uitprobeerders en slimme knutselaars voor nodig die in de open community niet alleen gratis maar ook in veel grotere getale aanwezig zijn. 

De Open Source-gemeenschap heeft een veel lagere toetredingsdrempel, waardoor meer mensen kunnen bijdragen. Als we veel verschillende mensen bij elkaar zetten en ze samen laten koken, gebeuren er geweldige dingen. De snelle ontwikkeling van echt open AI is daar een duidelijk voorbeeld van. Dat is nu ook onderkend vanuit Google zelf. Met AI zelf zul je geen geld (meer) kunnen verdienen, alleen met producten die je daar omheen bouwt. Het was een slimme zet van Meta om vorig jaar hun AI-model vrij te geven, terwijl hun concurrenten miljarden investeerden in de LLM-oorlogen, waar uiteindelijk geen winstgevendheid meer te verwachten was. Ze werden verslagen door open source. 

Het moderne internet draait op open source

Open source software is niet langer een niche-term voor het bedrijfsleven en de overheid maar de de-facto methode voor software. Open source is de beste manier om softwarestandaarden voor elkaar te krijgen. Veel van de grootste software bedrijven zijn al sterk afhankelijk van open source; of het nu gaat om cloudleveranciers, softwareleveranciers, de gezondheidszorg, de financiële sector, telecommunicatie. Open source-software die de facto standaarden creëert, wordt ook snel zelf de norm. 

Een groot voordeel van het hebben van de-facto en goedgekeurde softwarestandaarden die open zijn, is dat ze de aantrekkingskracht van onnodige differentiatie wegnemen, waardoor bedrijven hun tijd, moeite en geld kunnen investeren waar het er echt toe doet. Voor een klant is een  investering gebaseerd op open standaarden de garantie van interoperabiliteit. De mogelijkheid  om naar een andere leverancier over te stappen. Of de eigen oplossingen te verbeteren door de norm rechtstreeks te beïnvloeden. Open source is immers niet alleen gebruiken maar ook geven. Dat is uiteindelijk haar grootste kracht!

Foto: Photo by Amanda on Unsplash