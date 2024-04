Google en OpenAI hebben transcripties van YouTube-video's gebruikt voor het trainen van AI-modellen, zo meldt The New York Times op basis van bronnen. Voor het trainen van AI-modellen zijn grote hoeveelheden data nodig en de techbedrijven vonden in YouTube een nieuwe databron. Bronnen laten aan de Amerikaanse krant weten dat OpenAI een spraakherkenningstool genaamd Whisper ontwikkelde die transcripties van YouTube-video's kon maken.

Op deze manier verwerkte OpenAI meer dan een miljoen uur aan YouTube-video's, aldus de bronnen. Ook Google gebruikte YouTube-transcripties voor het trainen van het eigen AI-model. Sommige Google-medewerkers wisten dat OpenAI YouTube-video's aan het scrapen was als databron. Google wilde hier echter niet tegen optreden, omdat het gebruik van YouTube-transcripties mogelijk in strijd met het copyright van YouTube-makers is.

Door op te treden tegen OpenAI zou er misschien ook kritiek op Googles werkwijze komen, zo laten de bronnen verder weten. In een reactie tegenover The New York Times verklaart Google dat het niet bekend is met het scrapen van YouTube-video's door OpenAI en dat dit ook verboden is. Wat betreft het gebruik van YouTube-video's erkent Google dat het 'YouTube-content' heeft gebruikt binnen de voorwaarden die het met YouTube-makers heeft, zo laat The Verge weten.

Naast Google en OpenAI keek ook Meta naar databronnen die het kon gebruiken. Uit interne opnames waarover The New York Times beschikt blijkt dat managers, advocaten en engineers onder andere bespraken hoe ze auteursrechtelijk beschermd werk op internet zonder toestemming konden gebruiken, ook al zouden er dan rechtszaken komen. Het onderhandelen over licenties met rechthebbenden zou namelijk te lang duren, zo werd er gesteld.