These 183,000 Books Are Fueling the Biggest Fight in Publishing and Tech

Artikeln avslöjar att en datamängd kallad "books3", innehållande över 191 000 piratkopierade böcker, har använts av företag som Meta och Bloomberg för att träna generativa AI-system. Flera författare, däribland Sarah Silverman, Michael Chabon och Paul Tremblay, har stämt Meta för upphovsrättsintrång, då deras verk använts utan tillstånd för AI-träning. Författare uttrycker oro över att deras böcker används icke-konsensuellt för att träna maskiner som potentiellt kan ersätta dem, medan AI-utvecklare står att tjäna stora pengar. Meta försvarar sig i Silvermans stämningsansökan genom att hävda att deras AI-modell, Llama, inte är "väsentligt lik" författarnas böcker. Artikeln belyser bristen på transparens kring AI-träningsmetoder och erbjuder ett sökverktyg för författare att kontrollera om deras verk finns med i "books3".