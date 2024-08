Stichting Brein heeft een Nederlandstalige dataset die gebruikt werd voor het trainen van AI-modellen offline gehaald. Volgens Brein ontdekte het na een tip dat de dataset bestond uit illegale kopieën van tienduizenden boeken, miljoenen regels uit nieuwsartikelen van websites en ondertitels van talloze films en tv-series uit illegale bron.

"Hoewel de dataset daarmee niet direct geschikt was voor consumenten om te lezen als e-book of nieuwswebsite, is dit niet toegestaan. Het kopiëren en dus ook het dataminen uit illegale bron is nooit toegestaan. Ook voor het dataminen van legale bronnen met een auteursrechtenvoorbehoud is toestemming van de auteursrechthebbenden vereist", zo laat de stichting in een persbericht weten.

Niet alleen is de dataset offline gehaald, de maker ervan heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken. Tevens heeft hij informatie gegeven over ontvangers van de dataset. Brein onderzoekt nu welke AI-modellen deze dataset hebben gebruikt en zegt de betrokken partijen te zullen aanspreken.