Membangun agen AI dalam produksi? Empat poin dari sesi saya dengan David Kim (@braintrustdata): 1. Bangun eval sebelum kode agen. Lingkungan uji pertama, implementasi kedua 2. Tunggu kemampuan model yang tepat. Mereka memegang Loop selama berbulan-bulan sampai model lulus eval mereka 3. Jangan membuat hardcode urutan alat. Berikan prinsip kepada agen, bukan instruksi yang kaku 4. Kirim minimal dan iterasi. Fitur Loop yang paling banyak digunakan tidak ada dalam desain aslinya Eval yang kuat memungkinkan Anda bergerak cepat. Pengguna sungguhan menunjukkan apa yang akan terjadi selanjutnya.