Dit is super interessant! ScaleAI en AI Risks hebben zojuist de Remote Labor Index (RLI) uitgebracht. - De nieuwe Remote Labor Index (RLI) benchmark van Scale AI onthult dat zelfs de meest geavanceerde AI-agenten nauwelijks in staat zijn om echte afstandswerkzaamheden op professioneel niveau uit te voeren. - De beste presteerder, Manus, behaalde slechts een automatiseringspercentage van 2,5%, wat betekent dat bijna alle projecten nog steeds menselijke expertise vereisten. - Toch toont de ranglijst een gestage vooruitgang bij modellen zoals Claude Sonnet 4.5, GPT-5 en Gemini 2.5 Pro, wat erop wijst dat volledige automatisering mogelijk geleidelijk vooruitgang kan boeken door incrementele verfijningen in plaats van sprongen.