Поддерживают ли модели ИИ процветание человека? Это довольно важный вопрос для отрасли (и для меня лично). Мы не можем повторять беды рейтинга кликов в социальных сетях, определяющего поведение... ИИ в целом (и базовые модели в частности) слишком важны. Чтобы найти ответы на эти вопросы, наша команда в @gloo создала бенчмарк Flourishing AI (FAI). Он представляет новый метод оценки систем ИИ по семи параметрам: характер, отношения, счастье, смысл, здоровье, финансы и вера. Наша цель состоит в том, чтобы все модели достигли процветающих стандартов на уровне 90% или выше, и сегодня это путешествие начинается. Мы обнаружили, что современные модели ИИ демонстрируют сильные стороны в прагматических областях (таких как счастье и финансовая стабильность), но все модели не смогли достичь сбалансированной производительности по всему спектру измерений, особенно в этических рассуждениях, экзистенциальной рефлексии и духовности. Мы только начинаем работу над FAI Benchmark и делимся им открыто, чтобы пригласить к экспертной оценке, доработке и более широкому сотрудничеству. Чтобы узнать больше, ознакомьтесь с результатами и загрузите исследовательскую работу здесь –
7,62K