GitHub - bigscience-workshop/petals: 🌸 Run LLMs at home, BitTorrent-style. Fine-tuning and inference up to 10x faster than offloading

Petals är ett system som möjliggör körning och finjustering av stora språkmodeller (LLMs) lokalt på ett distribuerat, BitTorrent-liknande sätt, vilket kan vara upp till 10 gånger snabbare än offloading. Systemet låter användare generera text med modeller som Llama 3.1, Mixtral, Falcon och BLOOM direkt från sin dator eller Google Colab, och erbjuder flexibilitet liknande PyTorch och Hugging Face transformers. Petals bygger på ett community-drivet nätverk där användare delar sina GPU:er för att hosta delar av modellerna, vilket bidrar till den totala kapaciteten. Det stöder flera operativsystem (Linux, Windows WSL, macOS) och erbjuder funktioner för dataskydd genom publika eller privata swarms. Projektet är en del av BigScience-forskningen och tillhandahåller omfattande dokumentation, tutorials och verktyg för användning och bidrag.