Artikeln är en omfattande guide till offentligt tillgängliga stora datamängder, organiserade i olika kategorier. Den listar generiska datarepositorier som Amazon AWS, Infochimps och CKAN, samt specifika samlingar från Stanford och OpenFlights. En betydande del ägnas åt geografisk data från källor som Wikipedia, OpenStreetMap och Natural Earth. Artikeln inkluderar även webbdata från Google N-gram, Freebase och Stack Overflow, samt en sektion för regeringsdata från USA, Storbritannien, EU och FN. Syftet är att ge användare pekare och resurser för att få erfarenhet av att arbeta med stora datamängder.