Das ist super interessant! ScaleAI und AI Risks haben gerade den Remote Labor Index (RLI) veröffentlicht. - Der neue Remote Labor Index (RLI) Benchmark von Scale AI zeigt, dass selbst die fortschrittlichsten KI-Agenten kaum in der Lage sind, reale Remote-Jobs in professioneller Qualität auszuführen. - Der beste Performer, Manus, erreichte nur eine Automatisierungsrate von 2,5 %, was bedeutet, dass fast alle Projekte weiterhin menschliche Expertise erforderten. - Dennoch zeigt die Rangliste einen stetigen Fortschritt bei Modellen wie Claude Sonnet 4.5, GPT-5 und Gemini 2.5 Pro, was darauf hindeutet, dass die vollständige Automatisierung durch schrittweise Verbesserungen und nicht durch Sprünge vorankommen könnte.