Big Data Analytics (with Hadoop and PHP) (DPC2013 2013-06-06)

Artikeln behandlar utmaningarna med Big Data och presenterar MapReduce som en grundläggande lösning för distribuerad databehandling. Hadoop beskrivs som den industriella standarden för batchbearbetning av stora datamängder, inklusive dess filsystem HDFS och möjligheten att använda olika skriptspråk via Hadoop Streaming. Hadoophp introduceras som ett PHP-ramverk för att underlätta utvecklingen av MapReduce-jobb. För realtidSANalys av Big Data presenteras Twitter Storm som ett alternativ till batchbearbetning, med dess arkitektur av spouts, bolts och topologier.