Rantai Agen Ide menarik untuk melatih satu model dengan kemampuan sistem multi-agen. Pengurangan 84,6% dalam biaya inferensi! Distilasi dan Agentic RL bukanlah lelucon! Berikut adalah catatan saya:
73,24K