image

Ruim 100.000 ChatGPT-gesprekken geïndexeerd door Internet Archive

maandag 4 augustus 2025, 10:36 door Redactie, 9 reacties
Laatst bijgewerkt: Vandaag, 13:34

Ruim 100.000 gesprekken die mensen met ChatGPT voerden zijn via Archive.org te vinden, zo ontdekte onderzoeksjournalist Henk van Ess van Digital Digging. De gesprekken werden via een feature van ChatGPT door zoekmachines geïndexeerd. OpenAI heeft deze feature inmiddels verwijderd en vijftigduizend geïndexeerde gesprekken bij Google laten verwijderen, maar meer dan 100.000 ChatGPT-gesprekken zijn nog via Archive.org te vinden.

De chatbot biedt gebruikers de optie om een chat te delen, waarbij er een link wordt gecreëerd. Deze link, die naar het gehouden gesprek wijst, kan de gebruiker naar iemand sturen of voor zichzelf bewaren. Wanneer een link was aangemaakt verscheen onder de link ook een checkbox met de tekst "Make this chat discoverable". In kleinere grijze letters stond daaronder dat het gesprek in 'web searches' kon worden weergegeven. Tal van gebruikers selecteerden deze optie.

Fast Company meldde vorige week dat hierdoor duizenden gesprekken via Google Search te vinden waren. In sommige van de gesprekken werden zeer persoonlijke details gedeeld. Volgens Simon Willison, medeoprichter van het webframework Django, zijn er verschillende dingen mis met het venster dat ChatGPT-gebruikers kregen te zien. Het eerste probleem was de woordkeuze. "Discoverable" is geen algemeen bekende term, aldus Willison. "Het is insider jargon". Gebruikers zouden dan ook over allerlei kennis moeten beschikken om te begrijpen wat de optie precies doet.

"ChatGPT heeft meer dan een miljard gebruikers nu. Dat houdt in dat er een grote variëteit aan technische expertise onder deze gebruikers is", merkt de Django-ontwikkelaar op. Hij stelt dat er niet zomaar van kan worden uitgegaan dat iedereen de gevolgen van de checkbox begrijpt. Daarnaast lezen gebruikers niet, gaat Willison verder. "Wanneer mensen een applicatie gebruiken zoeken ze altijd naar het absoluut kortste pad om hun doel te bereiken. Elk dialoogvenster of vraag die verschijnt is iets om zo snel mogelijk over te slaan." Daarnaast slaat de feature volgens Willison nergens op, aangezien de meeste mensen die hun chats met anderen willen delen niet denken om die ook via Google voor iedereen op internet beschikbaar te maken.

Archive.org

Onderzoeksjournalist Henk van Ess ontdekte allerlei gevoelige zaken in de geïndexeerde chatgesprekken. Nadat hij hierover had bericht liet OpenAI bijna vijftigduizend geïndexeerde gesprekken door Google uit de zoekresultaten van de zoekmachine verwijderen. Van Ess ontdekte vervolgens dat 110.000 ChatGPT-gesprekken via Archive.org zijn te vinden, ook bekend als de Wayback Machine. Archive.org indexeert allerlei websites en webpagina's.

Volgens Van Ess heeft OpenAI de meest basale regel van het internet vergeten, namelijk dat niets echt weg is. Het Internet Archive liet tegenover de journalist weten dat het nog geen verzoek van OpenAI had ontvangen om de geïndexeerde ChatGPT-gesprekken te verwijderen. Internet Archive heeft beleid om links op verzoek van rechtenhouders te verwijderen. "Aangezien gebruikers deze chats vrijwillig hebben gedeeld is de vraag wie de rechtenhouders zijn?", stelt Van Ess de vraag.

Image

Reacties (9)
Vandaag, 10:57 door Anoniem
Potverdorie! Dit is helamaal door de vingers geglipt bij The Internet Archive. Niet met kwade opzet dus. Maar de kortzichtige kritiek zal wel weer niet van de lucht zijn en dat terwijl ik vorige week ergens op Mastodon.social las dat The Archive in een bepaald land (weet niet meer welk) het voornemen bestaat om het te blokkeren. Het internet wordt een almaar triestere bende. Enerzijds door allerhand tuig dat de zaak exponentieel aan het verzieken is en anderzijds door toedoen van doorgeslagen regelgeving.
Zo jammer allemaal!
Vandaag, 11:28 door Anoniem
Wow, wat een baanbrekend inzicht. Gesprekken die je zelf publiek maakt, zijn... publiek? Nooit aan gedacht!
Vandaag, 11:34 door Anoniem
Talk dirty to me…
Vandaag, 11:35 door Anoniem
En hier zien we weer een voorbeeld van de domheid van de mens. Het stond default niet aan. Moet ik echt nog wat toevoegen?

Ik zie geen enkel probleem. Users wilde dit zo. We gaan over tot de orde van de dag.

Laten we vooral het internet niet naar het niveau van dit soort mensen brengen. Daar is niemand bij gebaat. Helaas is dat wel wat we constateren. En niet alleen op het internet. De hele planeet in rubbertegels straks.
Vandaag, 12:15 door Anoniem
Reden om daar straks ook eens de desinformatie- of onwelgevallige-info-bezem doorheen te halen.

Meestal gebeuren bijna alle dingen op onze planeet met een reden.

Een conspiracy tot de werkelijkheid je gelijk komt geven.
Vandaag, 12:27 door Joep Lunaar
Willison: ... Daarnaast lezen gebruikers niet, gaat Willison verder. "Wanneer mensen een applicatie gebruiken zoeken ze altijd naar het absoluut kortste pad om hun doel te bereiken. Elk dialoogvenster of vraag die verschijnt is iets om zo snel mogelijk over te slaan." Daarnaast slaat de feature volgens Willison nergens op, aangezien de meeste mensen die hun chats met anderen willen delen niet denken om die ook via Google voor iedereen op internet beschikbaar te maken.
.
Dat zet het probleem goed neer. "Informed consent" is meestal een fictie en dus zijn wetten nodig die materieel (inhoudelijk, niet processueel) grenzen stellen, maar dat is ook niet eenvoudig want hoe kun je in abstracto grenzen stellen zonder bevoogding (of erger indirecte censuur)? En ga er maar vanuit dat OpenAI die checkbox er echt heeft neergezet met het oog op een voordeel voor dat bedrijf, belangen van de aanbieder gaan altijd boven die van de klanten, tenzij een regel daar paal en perk aan stelt.
Vandaag, 13:59 door Anoniem
Daarom draai ik dus al mijn modellen lokaal, heb ik geen gezeur met censuur, en "over-vriendelijke AI's", maar ik ben autonoom en heb privacy.
Als de stroom uitvalt en er geen internet is heb ik nog steeds mijn AI op mijn apparaten. (Heb een mobiel zonnepaneel om deze op te laden)
Vandaag, 14:47 door Anoniem
En dit verbaasd wie precies?

ChatGPT en alle soortgelijkende LLM's die er zijn verzamelen data waar vroeg of laat iemand bij kan.
Nu is het doordat mensen niet opletten, de volgende keer is het een foutje en daarna worden ze nog een keer gehackt en ligt de gehele database op straat.
Nee ik ben geen voorstander van AI in het algemeen, ik zie alleen maar veel nadelen en weinig voordelen.
Vandaag, 15:14 door Anoniem
The Internet Archive in een negatief daglicht proberen te stellen
het te ontmoedigen.

Ze worden lastig gevallen door hackpogingen,en nu weer meer negativiteit.

Waarom komt dit nu steeds vaker voor
ze zijn niet blij met de Internet Archive.

Vraag?

Waarom zou je uberhaut zelf mogen of willen nadenken.
Waarom zou je uberhaut zelf iets willen bezitten.
Waarom zou je uberhaut nog iets zelf willen repareren.
Waarom zou je uberhaut nog iets creatiefs zelf mogen doen.

Dit is natuurlijk veelal oude software,maar ook oude handleidingen voor reparaties
en vragen en kennis,waarom willen ze daar nu de controle over hebben,
zodat het niet meer voorhanden is?

Tja het is natuurlijk domme software wat niet smart is,
maar ook kun je zelf nog nadenken en zelf iets repareren op eigen kracht en eigen wil.

Je bent niet te afhankelijk door dat je zelf iets bezit,en waar je niet vast komt te zitten aan
abonnementen service of een gekocht apparatuur dat uitvalt om je niet betaald hebt.
iets kopen betekend in de toekomst dat je alleen maar mag gebruiken het is niet meer
van jou,(You own nothing principe)

Handleidingen en software maar ook oude printers uit
de periode 1998-2002 die straks niet meer te vinden zijn,koester ze zolang als mogelijk
het geeft jou vrijheid en je privacy terug.

Het is heel vervelend voor ze als ze jou als burger niet kunnen controleren want software
wat niet smart of slimme software,of ai is.

Ze willen alle oude software weg hebben,dus blijf back-uppen,maak zoveel mogelijk digitale iso
van je oude software en van alle oude handleidingen maak ze digitaal en gooi boekjes van
oude handleidingen en software niet weg.

WereldNU2025

.
Reageren
Ondersteunde bbcodes
Bold: [b]bold text[/b]
Italic: [i]italic text[/i]
Underline: [u]underlined text[/u]
Quote: [quote]quoted text[/quote]
URL: [url]https://www.security.nl[/url]
Config: [config]config text[/config]
Code: [code]code text[/code]

Je bent niet en reageert "Anoniem". Dit betekent dat Security.NL geen accountgegevens (e-mailadres en alias) opslaat voor deze reactie. Je reactie wordt niet direct geplaatst maar eerst gemodereerd. Als je nog geen account hebt kun je hier direct een account aanmaken. Wanneer je Anoniem reageert moet je altijd een captchacode opgeven.