Chain-of-Agents Interessante Idee, ein einzelnes Modell mit den Fähigkeiten eines Multi-Agenten-Systems zu trainieren. 84,6 % Reduktion der Inferenzkosten! Distillation und Agentic RL sind kein Scherz! Hier sind meine Notizen:
85,37K