¿Construyendo agentes de IA en producción? Cuatro conclusiones de mi sesión con David Kim (@braintrustdata): 1. Compile evaluaciones antes del código del agente. Entornos de prueba primero, implementación después 2. Espere las capacidades del modelo adecuadas. Mantuvieron Loop durante meses hasta que las modelos pasaron sus evaluaciones 3. No codifique secuencias de herramientas. Dar a los agentes principios, no instrucciones rígidas 4. Envíe lo mínimo e itere. La característica más utilizada de Loop no estaba en el diseño original Las evaluaciones fuertes te permiten moverte rápido. Los usuarios reales te muestran lo que sigue.