
OPINIE – Het voelt een beetje als een déjà vu naar de tijd waar PTT Telecom met ‘Het Net’ een poging deed om een Nederlands ‘www’ te ontwikkelen. Met GPT-AI ontwikkelt TNO samen met een aantal uitgevers een AI taalmodel, als ethisch alternatief ten opzichte van bestaande modellen van de ‘big-tech’ monopolisten. Gaat dat werken?
• Leestijd ca. 3 minuten

Onder ethisch verstaan TNO en de aangesloten uitgevers samen met het ANP (met meer dan 30 landelijke- en regionale titels) vooral dat het datamodel hoogwaardig en betrouwbaar is en dat gebruikers betalen voor de verkregen content. Als het model op de markt wordt gebracht zullen uitgevers een passende vergoeding ontvangen. GPT-NL is twee jaar geleden als onderzoekproject van start gegaan. Afgelopen maand is de training GPT-NL van start gegaan. In het vierde kwartaal van dit jaar wordt het model verder verbeterd en het eerste gebruik ervan voorbereid.

Dit in tegenstelling tot de huidige modellen, waarbij AI programmatuur zelfs tot achter de betaalmuur kan kruipen om content te benaderen en te gebruiken binnen hun modellen. Het taalmodel dat ChatGPT van OpenAI gebruikt ongevraagd data van het hele internet, waaronder privacygevoelige gegevens en auteursrechtelijk materiaal, waar dus geen toestemming voor is gegeven.
NDP Nieuwsmedia op haar website: “Het is wereldwijd de eerste keer dat nieuwsuitgevers op deze manier samenwerken met een organisatie die een AI-model ontwikkelt.”
GPT-NL is een initiatief van non-profitorganisaties TNO, NFI (Nederlands Forensisch Instituut) en SURF (SURF is de ict-coöperatie van Nederlandse onderwijs- en onderzoeksinstellingen). Samen bieden zij een verantwoord alternatief voor bestaande taalmodellen. De initiatiefnemers stellen dat het taalmodel voldoet aan alle mogelijke geldende landelijke- en europese wetgeving op het gebied van privacy, copyrights, zoals ‘ons eigen AVG‘, maar ook de europese AI-Act.
20 miljard tokens
Tokens zijn kleine stukjes tekst (woorden, delen van woorden of kleine paragrafen en zelfs leestekens) die een AI-model gebruikt om taal te verwerken en begrijpen. GPT-NL claimt met 20 miljard tokens de samenhang van alle nieuwsmedia bij elkaar in een model te kunnen verwerken, verdeeld over talloze thema’s, van politiek en economie tot zorg en wetenschap.
Big-tech: ‘Zonder toestemming’

Voorzitter van NDP Nieuwsmedia Rien van Beemen zegt dat de ‘big-tech’ taalmodellen ontwikkelt zonder explicite toestemming van uitgevers. In feite lijkend op de ‘oude RSS’ feeds waarmee in de tijd van de opkomt van het www open content van uitgevers werd geïndexeerd door zoekmachines en op die manier adverteerders trok doordat de ‘big-tech’ bedrijven hun bereik vergrootten, zonder dat daarvoor betaald werd. En dat trok massaal adverteerders ten koste van diezelfde uitgevers.
Talloze juridische procedures veranderden destijds niets aan die situatie. Uitgevers moesten zich heruitvinden en kwamen (traag) tot de conclusie dat zij hun eigen content zelf achter betaalmuren moesten gaan plaatsen om uiteindelijk een haalbaar verdienmodel te ontwikkelen in een tijd dat papieren edities in oplages daalden. Na decennia is dat uiteindelijk gelukt met uitgevers als DPG Media en Mediahuis voorop.
GPT-NL geen alternatief voor ChatGPT voor consumenten
GPT-NL richt zich echter niet op consumenten. In diverse berichten verschijnen berichten alsof GPT-NL een alternatief zou willen bieden voor ChatGPT. Dat is nadrukkelijk niet het geval. GPT-NL richt zich op de professionele eindgebruiker, die met het taalmodel zelf ook weer betrouwbare content kan maken op basis van gecontroleerde content die het model voedt.
Doel: “GPT-NL heeft als doel de positie van de journalistiek in Nederland op termijn te verstevigen.”

Grondlegger van GPT-NL, Selmar Smit van TNO zegt in de media: “We zijn trots op deze samenwerking. De leden van NDP Nieuwsmedia leveren niet alleen hoogwaardige data, maar geven ook een krachtig signaal af: door samenwerking kan AI verantwoord worden ontwikkeld, met respect voor auteursrecht en publieke waarden.”
Eerdere Nederlandse organisaties die zich aansloten als dataleverancier bij GPT-NL zijn o.a. DNB (De Nederlandsche Bank), ICTRecht en Het Utrechts Archief.
Kansrijk of kansloos?
Wat overblijft is de vraag of de Nederlandse journalistiek zich wel zo exclusief gaat richten op de bronnen die nu binnen het taalmodel gaan functioneren. Het gebruik van ChatGPT, DeepSeek, Perplexity, Copilot en nog wat kleiner spelers, is al zo ingeburgerd, dat het niet waarschijnlijk lijkt dat deze gereedschappen terzijde gelegd zullen worden zodra GPT-NL op de één of andere manier via een website en/of app beschikbaar zal zijn.
Het voelt als een stukje ‘isolatie’ ten opzichte van de ‘grote buitenwereld’ te vergelijken met ‘Het Net‘ waarin destijds PTT Telecom samen met uitgevers een Nederlands (gesloten) ‘www’ (een soort nationaal intranet) wilden gaan ontwikkelen. Dat is nooit van de grond gekomen, ondanks de vele samenwerkingsvormen die werden gevonden tot zelf binnen de grafische branche. Prepress bedrijf Neroc stapte destijds ook in binnen het bedrijfsonderdeel Neroc Special Services.
Het mislukte, per 1 november 2009 verdween uiteindelijk ‘Het Net’, dat het eerste daglicht zag in 1997.
Geef een reactie
Je moet ingelogd zijn op om een reactie te plaatsen.