Door Anoniem: Ik snap helemaal het punt, maar ik vraag me wel af of je hiermee jezelf niet in de voet schiet als het gaat om de strijd met de gesloten concurrentie welke gewoon met AI-assistentie op een veel hogere snelheid door kan stomen
Neemt QEMU, en open source in het algemeen, dan deel aan die commerciële concurrentiestrijd waarin markten veroverd moeten worden en concurrenten worden afgetroefd? Ik denk het niet. Open source-projecten zijn typisch meer bezig om in hun eigen tempo hun eigen product gestaag beter te maken, en dat bereikt op een gegeven moment een niveau waarin het zich kan meten met commerciële producten. Dat kan omdat de basis, de kernfunctionaliteit, op een gegeven moment nou eenmaal domweg goed is geworden. In zekere zin is het vaak zelfs beter omdat de ontwikkelinspanning niet gericht is op anderen aftroeven met shiny toeters en bellen maar simpelweg op een degelijke werking. Die werking wordt namelijk niet vervuild met de resultaten van die competitieve scoringsdrang, die gaat simpelweg over waar het eigenlijk over moet gaan, zonder onzin eromheen.
Zo perfect is het natuurlijk ook weer niet altijd, maar het beeld is er in grote lijnen wel degelijk. Als je kijkt naar hoe open source zich ontwikkeld heeft, en dan niet overslaat hoe het er twintig of dertig jaar geleden voorstond, dan zie je dat het is uitgegroeid van iets marginaals tot iets dat universeel aanwezig is, zonder ooit voorop te hebben gelopen in de hypes, de concurrentiestrijd, de fancy features. En toch werd het steeds belangrijker. Dat kan omdat uiteindelijk al die hypes niet zijn waar het om gaat, je mist de boot niet als je niet voorop loopt. Waar het wel om gaat is dat we een degelijke basis hebben voor degelijke gegevensverwerking, en die degelijke basis stuitert niet alle kanten op, van de ene hype naar de andere, die degelijke basis is juist opmerkelijk stabiel. Als je je daarop richt loop je niet voorop maar kom je uiteindelijk wel het verst, dan stop je je energie in wat er uiteindelijk werkelijk toe doet (en daar zouden onze politici en regeringen zich eens bewust van moeten worden in plaats van bang te zijn de boot te missen als ze niet achter elke hype aanhollen).
Een ander punt is dat het maar de vraag is of de winst van AI werkelijk zo groot is. Het ene onderzoek claimt 66% productiviteitswinst voor generatieve AI, het andere komt niet verder dan 14%. Dat loopt nogal uiteen.
Bedenk dat generatieve AI, de AI-variant die al jaren zo aan het hypen is, helemaal niet kan redeneren maar alleen uit de voorbeeldpatronen waarmee het getraind is soortgelijke patronen produceert. Dat gebeurt op zo'n razend knappe manier dat er bij tekstgeneratie (ChatGPT en dergelijke) goed opgebouwde teksten uitrollen die heel overtuigend overkomen, maar bijvoorbeeld bij vrij simpele rekensommen gaat het al gierend de mist in. Dat wordt opgevangen door die rekensommen te herkennen en daar een traditioneel rekenalgoritme zonder AI op los te laten. Men wordt steeds beter in het afvangen van dat soort fouten, maar het komt er wel op neer dat de generatieve AI als het erop aankomt eigenlijk zo stom is als het achtereind van een varken, gierend de mist in kan gaan, en die blunders op een even overtuigend overkomende manier presenteert als wat goed gaat omdat het zelf geen benul heeft van wat goed of fout is, het kan helemaal niet werkelijk nadenken en heeft geen werkelijk inzicht.
Als je dat even goed tot je door laat dringen, en dan loslaat op generatieve AI voor het schrijven van software, dan kan het niet anders dan dat het goed is in codefragmenten waarvan er dertien in het dozijn gaan, want daar zijn veel voorbeelden van. Als het gaat om zeer specialistische, weinig voorkomende code dan wordt de kans op onzin (vergelijkbaar met die rekenfouten) veel groter, er zijn namelijk weinig of geen voorbeelden, en het is te specialistisch om net als die rekensommen te herkennen en af te vangen. QEMU is iets heel specialistisch. Ik heb het niet uitgezocht, maar de kans lijkt me groot dat het in zijn soort de enige software is waarvan de broncode publiek beschikbaar is en waar generatieve AI-systemen mee getraind kunnen worden. Als je dan iets nieuws aan QEMU toe zou willen voegen ontbreekt nou net de basis om dat te kunnen doen in het relevante deel van de de AI-trainingsdata. Als je fouten in de software ermee zou willen herstellen zit die fout per definitie ook in de relevante AI-trainingsdata, zonder een menigte aan correcte tegenvoorbeelden die zwaarder wegen in het resultaat. Daar ga je niet veel aan hebben.
Juist bij zoiets specialistisch als QEMU denk ik dat de toegevoegde waarde van generatieve AI minimaal is, alleen op makkelijke delen van de code betrekking kan hebben, en dat de kans groot is dat het meer kwaad dan goed doet.
Ik denk dat ze zichzelf helemaal niet in de voet schieten.