Cadena de agentes Interesante idea para entrenar un solo modelo con las capacidades de un sistema multiagente. ¡Reducción del 84,6% en el costo de inferencia! ¡La destilación y Agentic RL no son una broma! Aquí están mis notas:
85.37K