Může umělá inteligence skutečně automatizovat pracovní místa? @Scale_AI a @ai_risks spouštějí index práce na dálku (RLI), první benchmark a veřejný žebříček, který testuje, jak dobře mohou agenti umělé inteligence dokončit skutečnou, placenou práci na volné noze v oblastech, jako je softwarové inženýrství, design, architektura, analýza dat a další. První výsledky ukazují limity dnešních modelů. Špičkový agent umělé inteligence dokončil pouze 2,5 % skutečných pracovních míst na volné noze lépe než lidé. Umělá inteligence je výkonná, ale zatím není dostatečně spolehlivá, aby nahradila kvalifikovanou pracovní sílu. RLI nám poskytuje transparentní způsob, jak sledovat pokrok v průběhu času a vnést jasno do budoucnosti práce.