Wordt jouw boek illegaal gebruikt om AI te trainen?

Dat e-boeken op grote schaal illegaal te downloaden zijn van sites waar ze illegaal gratis beschikbaar worden gesteld, zonder enig overleg met rechthebbenden zoals auteurs, vertalers en uitgeverijen, is al geruime tijd bekend. Soms worden de sites uit de digitale lucht gehaald, maar even vaak duiken ze in net iets andere gedaante elders weer op.

Iets minder bekend is wellicht dat deze illegale verzamelingen ook op grote schaal door tech-bedrijven zijn gebruikt om hun AI’s te ontwikkelen. Het gezaghebbende The Atlantic beschrijft in een artikel hoe dat in zijn werk is gegaan en vermoedelijk nog steeds gebeurt. En men heeft het mogelijk gemaakt om de database van LibGen, de grootste, meest gebruikte illegale collectie, te doorzoeken. Zo kunnen schrijvers, vertalers en uitgevers checken of hun boeken ook zijn gebruikt om de AI’s van Big Tech te trainen.

Het artikel waarin de zoekmachine is opgenomen, vind je hier: The Unbelievable Scale of AI’s Pirated-Books Problem

Je kunt ook direct naar een aparte pagina voor de zoekmachine: Search LibGen, the Pirated-Books Database That Meta Used to Train AI – The Atlantic

Vertalersnamen zijn niet altijd terug te vinden in de database, auteursnamen wel. Engelse titels worden het eerst getoond, maar je kunt de titels per taal doorlopen.
Dat een titel voorkomt, betekent niet per se dat die daadwerkelijk gebruikt is om AI te trainen, al is de kans groot. Met name gevonden boeken die pas een jaar oud zijn of nog jonger zijn, zijn de dans misschien ontsprongen, al vertellen de techbedrijven niet of ze met hun illegale praktijken zijn gestopt. En de titels zijn dan sowieso wel illegaal gratis beschikbaar gesteld. Lees voor meer toelichting het artikel uit The Atlantic.

De kans is groot dat een boek in de database voorkomt. Van de boeken die ik de afgelopen vier jaar heb vertaald, verschijnt ongeveer de helft bij de zoekresultaten. Bij minstens één vermeldt het colofon expliciet dat zogenaamde tekst- en datamining niet is toegestaan…
Van collega’s komen soortgelijke verontrustende geluiden.

Vertalerseizoen

Het einde van het voorjaar en begin van de zomer betekent in de boekenwereld inmiddels dat de zonnestralen ook de vertalers weten te vinden. Het is de tijd van de nominaties voor de Filter Vertaalprijs (2x), de shortlist voor de Europese Literatuurprijs en de uitreiking van de Therèse Cornips Stipendia, nadat het voorjaar al mooi was begonnen met de Martinus Nijhoffprijs voor Paula Stevens, vertaler uit het Noors, en de longlist voor de Europese Literatuurprijs. De redactie van Nieuwsuur vond in de laatste prijs en alle ophef over de ontwikkeling van AI ook reden om een item aan het vertalen te wijden. Daarvoor interviewden ze drie vertalers: longlisters Brenda Lelie en Martin de Haan en jurylid en vorig winnaar Karina van Santen: https://nos.nl/nieuwsuur/video/2526137-prijs-voor-vertaalde-boeken-voelt-als-een-roeping

Boekvertalers.nl feliciteert Anne Mulleners en Lotte Lentes, Annelous Stiggelbout, Bette Westera, Floortje Schoevaart, Inge Piryns, Jan Fastenau, Jan van der Haar, Karol Lesman, Kiki Coumans (2x), Lette Vos, Liesbeth van Nes, Lore Aertsen, Maria Postema, Ralph Aarnout, Robert-Jan Henkes en Rokus Hofstede met hun nominatie of toekenning!

Lees wie met welk boek is genomineerd:

Filter Vertaalprijs 2024
Filter Vertaalprijs kinder- en jeugdboeken 2024
Europese Literatuurprijs 2024

en welke vertalers een Therèse Cornips Stipendium ontvingen.

De interviews voor Nieuwsuur leidden ook nog tot een interessant stukje op de site van de NOS: Vak van vertaler verandert: ‘AI bedreigt menselijke taal’. (Met twee foutjes: Brenda Lelie vertaalt niet in het Lets maar uit het Lets, en er wordt haar een uitspraak toegeschreven die uit de mond van Karina van Santen kwam.)

“We besteden onze menselijkheid uit aan een algoritme”

Vertaler en schrijver Martin de Haan schreef voor de Volkskrant een zeer lezenswaardig stuk over kunstmatige intelligentie in de wereld van de kunst en de literatuur en die van het vertalen in het bijzonder. Lees AI kan de menselijke vertaler overbodig maken. Maar waarom zouden we dat willen?

Deze illustratie van Leonie Bos verlucht het krantenartikel