Chain-of-Agents Idea interessante quella di addestrare un singolo modello con le capacità di un sistema multi-agente. Riduzione del 84,6% nei costi di inferenza! La distillazione e il RL agentico non sono uno scherzo! Ecco le mie note:
81,21K