Djupinlärningsforskning kräver flexibel infrastruktur som stöder både snabb prototyputveckling och storskaliga, långvariga experiment. Artikeln beskriver en infrastruktur byggd med öppen källkod som Kubernetes, AWS och fysiska servrar för att hantera varierande arbetsbelastningar. Ett exempel från GAN-forskning av Tim Salimans och Ian Goodfellow illustrerar behovet av skalbar infrastruktur, från småskaliga tester till storskaliga imagenet-experiment. Författarna släpper Kubernetes-ec2-autoscaler, en batch-optimerad skalningshanterare för Kubernetes, för att möjliggöra dynamisk resursallokering. Infrastrukturen prioriterar användbarhet och erbjuder verktyg för beroendeisolering (Docker) och sömlös nätverksåtkomst (flannel, TensorBoard).