Artikeln belyser att GitHub Copilot tränar på kod under icke-tillåtande licenser som GPL, vilket skapar betydande juridiska risker för användare och företag. Det visas hur GitHub Copilot enkelt kan återskapa GPL-licensierad kod, även med dess inbyggda filter aktiverade, vilket indikerar att filtren är ineffektiva och försämrar prestandan drastiskt. Codeium presenterar sin lösning genom att hävda att de aktivt har exkluderat all GPL-licensierad kod från sin träningsdata för att garantera användarnas trygghet och undvika juridiska problem. Processen att helt eliminera GPL-kod från träningsdata är komplex, särskilt på grund av förekomsten av kopierad GPL-kod i repos med andra licenser. Artikeln argumenterar för att post-genereringsfilter är en ofullkomlig lösning på licensproblemet, och att den enda säkra metoden är att inte träna på icke-tillåtande kod från början.