Ланцюжок агентів Цікава ідея навчити одиночну модель з можливостями мультиагентної системи. Зниження вартості логічного висновку на 84,6%! Дистиляція та Agentic RL – це не жарти! Ось мої нотатки:
85,37K