Может ли ИИ действительно автоматизировать рабочие места? @Scale_AI и @ai_risks запускают Индекс Удаленного Труда (RLI), первый эталон и публичный рейтинг, который проверяет, насколько хорошо ИИ-агенты могут выполнять реальную, оплачиваемую фриланс-работу в таких областях, как программная инженерия, дизайн, архитектура, анализ данных и многое другое. Ранние результаты показывают пределы сегодняшних моделей. Лучший ИИ-агент выполнил всего 2,5% реальных фриланс-работ лучше, чем люди. ИИ мощен, но пока не достаточно надежен, чтобы заменить квалифицированный труд. RLI предоставляет нам прозрачный способ отслеживать прогресс с течением времени и приносить ясность в будущее работы.