Common Crawl tillkännager regelbundet nya utgåvor av sina webbgrafer på värd- och domännivå samt arkiv med webbsidor, med flera uppdateringar under 2023 och 2024. Organisationen har gjort sin statistik tillgänglig på Hugging Face och diskuterar miljömässig påverkan av molntjänster genom en fallstudie om "greenops". Common Crawl engagerar sig i diskussioner kring AI-framsteg, etik och öppen källkod, bland annat genom att delta i evenemang som AI_dev-toppmötet i Paris och Open Search Symposium vid CERN. De har publicerat inlägg som förklarar webbarkiveringsfilformat (ARC, WARC, WET, WAT) och undersökt förekomsten av maskininlärnings-opt-out-protokoll för att balansera upptäckt och integritet.