MapReduce for Idiots

Författaren, Pete Warden, insåg att hans egenutvecklade process för att hantera stora datamängder var nästan identisk med MapReduce, trots initiala svårigheter att förstå konceptet. Artikeln förklarar MapReduce som en metod för att samla fragmenterad information om objekt genom att mappa data till nycklar, sortera dem och sedan reducera den sorterade datan. En enkel PHP-projekt och handledning tillhandahålls för att demonstrera MapReduce, som kan köras lokalt eller på Amazon Elastic MapReduce. Instruktioner ges för att sätta upp och köra ett MapReduce-jobb på Amazon Elastic MapReduce med hjälp av S3, EC2 och MapReduce-konsolen. Warden uttrycker skepsis mot Googles patentMapReduce, då han anser att processen är så pass uppenbar att den inte borde kunna patenteras.