Artikeln avslöjar att en datamängd kallad "books3", innehållande över 191 000 piratkopierade böcker, har använts av företag som Meta och Bloomberg för att träna generativa AI-system. Flera författare, däribland Sarah Silverman, Michael Chabon och Paul Tremblay, har stämt Meta för upphovsrättsintrång, då deras verk använts utan tillstånd för AI-träning. Författare uttrycker oro över att deras böcker används icke-konsensuellt för att träna maskiner som potentiellt kan ersätta dem, medan AI-utvecklare står att tjäna stora pengar. Meta försvarar sig i Silvermans stämningsansökan genom att hävda att deras AI-modell, Llama, inte är "väsentligt lik" författarnas böcker. Artikeln belyser bristen på transparens kring AI-träningsmetoder och erbjuder ett sökverktyg för författare att kontrollera om deras verk finns med i "books3".