Dette er superinteressant! ScaleAI og AI Risks har nettopp gitt ut Remote Labor Index (RLI) - Scale AIs nye Remote Labor Index (RLI)-referanse avslører at selv de mest avanserte AI-agentene knapt kan utføre eksterne jobber i den virkelige verden med profesjonell kvalitet. - Den beste utøveren, Manus, oppnådde bare en automatiseringsgrad på 2,5 %, noe som betyr at nesten alle prosjekter fortsatt krevde menneskelig ekspertise. -Likevel viser ledertavlen jevn fremgang på tvers av modeller som Claude Sonnet 4.5, GPT-5 og Gemini 2.5 Pro, noe som antyder at full automatisering kan gå fremover gjennom inkrementelle forbedringer i stedet for sprang.