AI真的能自动化工作吗? @Scale_AI 和 @ai_risks 正在推出远程劳动指数(RLI),这是第一个基准和公共排行榜,测试AI代理在软件工程、设计、建筑、数据分析等领域完成真实、有偿自由职业工作的能力。 初步结果显示了今天模型的局限性。顶级AI代理仅完成了2.5%的真实自由职业工作,表现优于人类。AI很强大,但还不够可靠,无法取代熟练劳动。 RLI为我们提供了一种透明的方式来跟踪进展,并为未来的工作带来清晰度。