Artikeln presenterar en teknik för förlustfylld textkomprimering, inspirerad av metoder som används i JPEG och MP3, där information permanent kasseras för att uppnå höga komprimeringsgrader. Kärnan i metoden är ett Perl-skript som använder en synonymordbok (thesaurus) för att ersätta ord med deras kortaste synonymer, vilket syftar till att minska filstorleken samtidigt som texten förblir läsbar. Processen innefattar att filtrera bort vissa ord och kan upprepas för ytterligare komprimering, men detta riskerar att leda till textdegradering ("generational loss") och göra dokumentet oläsbart. En medföljande dekompressor använder den längsta synonymen för att försöka återställa texten, och den använda synonymordboken är Moby thesaurus. Artikeln innehåller även Perl-kodexempel och utdata från komprimering av texter som USA:s självständighetsförklaring och delar av Bibeln och Moby Dick.