Questo è super interessante! ScaleAI e AI Risks hanno appena rilasciato l'Indice di Lavoro Remoto (RLI) - Il nuovo benchmark dell'Indice di Lavoro Remoto (RLI) di Scale AI rivela che anche gli agenti AI più avanzati possono a malapena svolgere lavori remoti nel mondo reale con qualità professionale. - Il miglior performer, Manus, ha raggiunto solo un tasso di automazione del 2,5%, il che significa che quasi tutti i progetti richiedevano ancora competenze umane. - Eppure, la classifica mostra progressi costanti tra modelli come Claude Sonnet 4.5, GPT-5 e Gemini 2.5 Pro, suggerendo che l'automazione completa potrebbe avanzare attraverso affinamenti incrementali piuttosto che salti.