Artikeln introducerar Apache Hadoop som en vanlig lösning för företag och forskningsorganisationer som hanterar stora datamängder, och belyser utmaningar med att befintlig IT-infrastruktur inte kan möta växande krav. Google Cloud Platform presenteras som ett attraktivt alternativ till att köpa och hantera egna servrar och lagringsenheter, genom att erbjuda högpresterande virtuella maskiner som betalas per minut. För att underlätta implementering och användning av Hadoop på Google Cloud Platform har Google släppt två lösningsdokument och två exempelapplikationer. Lösningsdokumenten är utformade för att hjälpa både nya användare att förstå och komma igång med Hadoop, MapReduce, Hive och Pig, samt att ge hanteringsråd för befintliga, långlivade Hadoop-kluster på Google Compute Engine. Exempelapplikationerna, tillgängliga som Github-projekt, syftar till att snabbt få användare igång genom att förenkla processen för att starta och hantera flera maskininstanser samt konfigurera programvara.