Remote Labor Index

Artikeln introducerar Remote Labor Index (RLI), ett nytt benchmark för att mäta AI:s förmåga att automatisera verkliga distansarbetsprojekt. RLI omfattar ett brett spektrum av ekonomiskt värdefulla fjärrarbetsprojekt från olika sektorer, inklusive spelutveckling, produktdesign och dataanalys. Nuvarande toppmoderna AI-agenter presterar mycket dåligt på RLI, med en maximal automationsgrad på endast 2,5%. Trots den låga automationsgraden visar analysen att AI-modellerna stadigt förbättras, vilket möjliggör spårning av framsteg inom AI-driven arbetsautomation.