Nieuws

Ruim 100.000 ChatGPT-gesprekken geïndexeerd door Internet Archive

maandag 4 augustus 2025, 10:36 door Redactie, 9 reacties

Laatst bijgewerkt: Vandaag, 13:34

Ruim 100.000 gesprekken die mensen met ChatGPT voerden zijn via Archive.org te vinden, zo ontdekte onderzoeksjournalist Henk van Ess van Digital Digging. De gesprekken werden via een feature van ChatGPT door zoekmachines geïndexeerd. OpenAI heeft deze feature inmiddels verwijderd en vijftigduizend geïndexeerde gesprekken bij Google laten verwijderen, maar meer dan 100.000 ChatGPT-gesprekken zijn nog via Archive.org te vinden.

De chatbot biedt gebruikers de optie om een chat te delen, waarbij er een link wordt gecreëerd. Deze link, die naar het gehouden gesprek wijst, kan de gebruiker naar iemand sturen of voor zichzelf bewaren. Wanneer een link was aangemaakt verscheen onder de link ook een checkbox met de tekst "Make this chat discoverable". In kleinere grijze letters stond daaronder dat het gesprek in 'web searches' kon worden weergegeven. Tal van gebruikers selecteerden deze optie.

Fast Company meldde vorige week dat hierdoor duizenden gesprekken via Google Search te vinden waren. In sommige van de gesprekken werden zeer persoonlijke details gedeeld. Volgens Simon Willison, medeoprichter van het webframework Django, zijn er verschillende dingen mis met het venster dat ChatGPT-gebruikers kregen te zien. Het eerste probleem was de woordkeuze. "Discoverable" is geen algemeen bekende term, aldus Willison. "Het is insider jargon". Gebruikers zouden dan ook over allerlei kennis moeten beschikken om te begrijpen wat de optie precies doet.

"ChatGPT heeft meer dan een miljard gebruikers nu. Dat houdt in dat er een grote variëteit aan technische expertise onder deze gebruikers is", merkt de Django-ontwikkelaar op. Hij stelt dat er niet zomaar van kan worden uitgegaan dat iedereen de gevolgen van de checkbox begrijpt. Daarnaast lezen gebruikers niet, gaat Willison verder. "Wanneer mensen een applicatie gebruiken zoeken ze altijd naar het absoluut kortste pad om hun doel te bereiken. Elk dialoogvenster of vraag die verschijnt is iets om zo snel mogelijk over te slaan." Daarnaast slaat de feature volgens Willison nergens op, aangezien de meeste mensen die hun chats met anderen willen delen niet denken om die ook via Google voor iedereen op internet beschikbaar te maken.

Archive.org

Onderzoeksjournalist Henk van Ess ontdekte allerlei gevoelige zaken in de geïndexeerde chatgesprekken. Nadat hij hierover had bericht liet OpenAI bijna vijftigduizend geïndexeerde gesprekken door Google uit de zoekresultaten van de zoekmachine verwijderen. Van Ess ontdekte vervolgens dat 110.000 ChatGPT-gesprekken via Archive.org zijn te vinden, ook bekend als de Wayback Machine. Archive.org indexeert allerlei websites en webpagina's.

Volgens Van Ess heeft OpenAI de meest basale regel van het internet vergeten, namelijk dat niets echt weg is. Het Internet Archive liet tegenover de journalist weten dat het nog geen verzoek van OpenAI had ontvangen om de geïndexeerde ChatGPT-gesprekken te verwijderen. Internet Archive heeft beleid om links op verzoek van rechtenhouders te verwijderen. "Aangezien gebruikers deze chats vrijwillig hebben gedeeld is de vraag wie de rechtenhouders zijn?", stelt Van Ess de vraag.

EFF: leeftijdsverificatie helpt niet om kinderen op internet te beschermen

Google blijft actief gebruikte links url-verkorter goo.gl toch behouden

Reacties (9)

Reageer met quote

Vandaag, 10:57 door Anoniem

Potverdorie! Dit is helamaal door de vingers geglipt bij The Internet Archive. Niet met kwade opzet dus. Maar de kortzichtige kritiek zal wel weer niet van de lucht zijn en dat terwijl ik vorige week ergens op Mastodon.social las dat The Archive in een bepaald land (weet niet meer welk) het voornemen bestaat om het te blokkeren. Het internet wordt een almaar triestere bende. Enerzijds door allerhand tuig dat de zaak exponentieel aan het verzieken is en anderzijds door toedoen van doorgeslagen regelgeving.
Zo jammer allemaal!

Reageer met quote

Vandaag, 11:28 door Anoniem

Wow, wat een baanbrekend inzicht. Gesprekken die je zelf publiek maakt, zijn... publiek? Nooit aan gedacht!

Reageer met quote

Vandaag, 11:34 door Anoniem

Talk dirty to me…

Reageer met quote

Vandaag, 11:35 door Anoniem

En hier zien we weer een voorbeeld van de domheid van de mens. Het stond default niet aan. Moet ik echt nog wat toevoegen?

Ik zie geen enkel probleem. Users wilde dit zo. We gaan over tot de orde van de dag.

Laten we vooral het internet niet naar het niveau van dit soort mensen brengen. Daar is niemand bij gebaat. Helaas is dat wel wat we constateren. En niet alleen op het internet. De hele planeet in rubbertegels straks.

Reageer met quote

Vandaag, 12:15 door Anoniem

Reden om daar straks ook eens de desinformatie- of onwelgevallige-info-bezem doorheen te halen.

Meestal gebeuren bijna alle dingen op onze planeet met een reden.

Een conspiracy tot de werkelijkheid je gelijk komt geven.

Reageer met quote

Vandaag, 12:27 door Joep Lunaar

Willison: ... Daarnaast lezen gebruikers niet, gaat Willison verder. "Wanneer mensen een applicatie gebruiken zoeken ze altijd naar het absoluut kortste pad om hun doel te bereiken. Elk dialoogvenster of vraag die verschijnt is iets om zo snel mogelijk over te slaan." Daarnaast slaat de feature volgens Willison nergens op, aangezien de meeste mensen die hun chats met anderen willen delen niet denken om die ook via Google voor iedereen op internet beschikbaar te maken.

.
Dat zet het probleem goed neer. "Informed consent" is meestal een fictie en dus zijn wetten nodig die materieel (inhoudelijk, niet processueel) grenzen stellen, maar dat is ook niet eenvoudig want hoe kun je in abstracto grenzen stellen zonder bevoogding (of erger indirecte censuur)? En ga er maar vanuit dat OpenAI die checkbox er echt heeft neergezet met het oog op een voordeel voor dat bedrijf, belangen van de aanbieder gaan altijd boven die van de klanten, tenzij een regel daar paal en perk aan stelt.

Reageer met quote

Vandaag, 13:59 door Anoniem

Daarom draai ik dus al mijn modellen lokaal, heb ik geen gezeur met censuur, en "over-vriendelijke AI's", maar ik ben autonoom en heb privacy.
Als de stroom uitvalt en er geen internet is heb ik nog steeds mijn AI op mijn apparaten. (Heb een mobiel zonnepaneel om deze op te laden)

Reageer met quote

Vandaag, 14:47 door Anoniem

En dit verbaasd wie precies?

ChatGPT en alle soortgelijkende LLM's die er zijn verzamelen data waar vroeg of laat iemand bij kan.
Nu is het doordat mensen niet opletten, de volgende keer is het een foutje en daarna worden ze nog een keer gehackt en ligt de gehele database op straat.
Nee ik ben geen voorstander van AI in het algemeen, ik zie alleen maar veel nadelen en weinig voordelen.

Reageer met quote

Vandaag, 15:14 door Anoniem

The Internet Archive in een negatief daglicht proberen te stellen
het te ontmoedigen.

Ze worden lastig gevallen door hackpogingen,en nu weer meer negativiteit.

Waarom komt dit nu steeds vaker voor
ze zijn niet blij met de Internet Archive.

Vraag?

Waarom zou je uberhaut zelf mogen of willen nadenken.
Waarom zou je uberhaut zelf iets willen bezitten.
Waarom zou je uberhaut nog iets zelf willen repareren.
Waarom zou je uberhaut nog iets creatiefs zelf mogen doen.

Dit is natuurlijk veelal oude software,maar ook oude handleidingen voor reparaties
en vragen en kennis,waarom willen ze daar nu de controle over hebben,
zodat het niet meer voorhanden is?

Tja het is natuurlijk domme software wat niet smart is,
maar ook kun je zelf nog nadenken en zelf iets repareren op eigen kracht en eigen wil.

Je bent niet te afhankelijk door dat je zelf iets bezit,en waar je niet vast komt te zitten aan
abonnementen service of een gekocht apparatuur dat uitvalt om je niet betaald hebt.
iets kopen betekend in de toekomst dat je alleen maar mag gebruiken het is niet meer
van jou,(You own nothing principe)

Handleidingen en software maar ook oude printers uit
de periode 1998-2002 die straks niet meer te vinden zijn,koester ze zolang als mogelijk
het geeft jou vrijheid en je privacy terug.

Het is heel vervelend voor ze als ze jou als burger niet kunnen controleren want software
wat niet smart of slimme software,of ai is.

Ze willen alle oude software weg hebben,dus blijf back-uppen,maak zoveel mogelijk digitale iso
van je oude software en van alle oude handleidingen maak ze digitaal en gooi boekjes van
oude handleidingen en software niet weg.

WereldNU2025

.

Reageren

Ondersteunde bbcodes

Bold: [b]bold text[/b]

Italic: [i]italic text[/i]

Underline: [u]underlined text[/u]

Quote: [quote]quoted text[/quote]

URL: [url]https://www.security.nl[/url]

Config: [config]config text[/config]

Code: [code]code text[/code]

Je bent niet ingelogd en reageert "Anoniem". Dit betekent dat Security.NL geen accountgegevens (e-mailadres en alias) opslaat voor deze reactie. Je reactie wordt niet direct geplaatst maar eerst gemodereerd. Als je nog geen account hebt kun je hier direct een account aanmaken. Wanneer je Anoniem reageert moet je altijd een captchacode opgeven.

Ben jij tijdens je vakantie bereikbaar voor collega's?

Vacature

Cybersecurity Trainer / Full Stack Developer

Ben je toe aan een nieuwe job waarmee je het verschil maakt? Wil jij je security kennis graag delen en hands-on laten zien hoe cybersecurity in de praktijk echt werkt? Werk je net als wij graag samen met enthousiaste en gedreven collega's? Bij ons geen bureaucratie maar open communicatie en een werkomgeving gericht op samenwerking.

Lees meer

Is het Belgian Anti Phishing Shield initiatief wel in overeenstemming met Europees recht?

30-07-2025 door Arnoud Engelfriet

Juridische vraag: Al een tijdje wordt in België het Belgian Anti Phishing Shield (BAPS) gebruikt. Als het Cyber Security ...

3 reacties

Lees meer

Vacature

Junior DevOps Engineer

Certified Secure is op zoek naar een Junior DevOps Engineer. Deze functie is een stuk interessanter dan de term doet vermoeden! Om jou als potentiële nieuwe collega meteen te laten zien wat we doen hebben we speciaal voor jou een selectie gemaakt van een aantal leuke security challenges. Are you ready for a challenge?

Lees meer

Hoe belangrijk is het vestigingsland van een VPN provider nou echt?

23-07-2025 door Arnoud Engelfriet

Juridische vraag: Op zoek naar een nieuwe mail en VPN provider, waarbij ik vooral het onderdeel privacy belangrijk vind, viel ...

17 reacties

Lees meer

Security.NL - X

10-01-2024 door Redactie

Altijd meteen op de hoogte van het laatste security nieuws? Volg ons ook op X!

Lees meer

Ruim 100.000 ChatGPT-gesprekken geïndexeerd door Internet Archive

Archive.org

Je reactie is verstuurd en wordt zo spoedig mogelijk gemodereerd.

Ben jij tijdens je vakantie bereikbaar voor collega's?

Wachtwoord Vergeten

Password Reset

Registreren