Bisakah AI benar-benar mengotomatiskan pekerjaan? @Scale_AI dan @ai_risks meluncurkan Indeks Tenaga Kerja Jarak Jauh (RLI), tolok ukur dan papan peringkat publik pertama yang menguji seberapa baik agen AI dapat menyelesaikan pekerjaan lepas berbayar nyata di domain seperti rekayasa perangkat lunak, desain, arsitektur, analisis data, dan banyak lagi. Hasil awal menunjukkan batasan model saat ini. Agen AI teratas hanya menyelesaikan 2,5% pekerjaan freelance nyata lebih baik daripada manusia. AI kuat, tetapi belum cukup andal untuk menggantikan tenaga kerja terampil. RLI memberi kami cara transparan untuk melacak kemajuan dari waktu ke waktu dan membawa kejelasan tentang masa depan pekerjaan.