Các mô hình AI có hỗ trợ sự phát triển của con người không? Đây là một câu hỏi khá quan trọng đối với ngành công nghiệp (và đối với cá nhân tôi). Chúng ta không thể lặp lại những tệ nạn của tỷ lệ nhấp chuột trên mạng xã hội thúc đẩy hành vi... AI nói chung (và các mô hình nền tảng nói riêng) quá quan trọng. Để tìm câu trả lời, nhóm của chúng tôi tại @gloo đã tạo ra Điểm chuẩn AI (FAI). Nó giới thiệu một phương pháp mới để đánh giá các hệ thống AI trên bảy khía cạnh: Tính cách, Mối quan hệ, Hạnh phúc, Ý nghĩa, Sức khỏe, Tài chính và Niềm tin. Mục tiêu của chúng tôi là thấy tất cả các mô hình đạt được các tiêu chuẩn phát triển mạnh mẽ ở mức hoặc trên 90% và hôm nay hành trình đó bắt đầu. Chúng tôi nhận thấy rằng các mô hình AI hiện tại thể hiện thế mạnh trong các lĩnh vực thực dụng (như Hạnh phúc và Ổn định tài chính), nhưng tất cả các mô hình đều không đạt được hiệu suất cân bằng trên toàn bộ các khía cạnh, đặc biệt là gặp khó khăn trong lý luận đạo đức, phản ánh hiện sinh và tâm linh. Chúng tôi chỉ mới bắt đầu với FAI Benchmark và chia sẻ nó một cách cởi mở để mời đánh giá, tinh chỉnh và hợp tác rộng rãi hơn. Để tìm hiểu thêm, hãy xem kết quả và tải xuống tài liệu nghiên cứu tại đây -
7,62K