エージェントの連鎖 マルチエージェントシステムの機能を使用して単一のモデルをトレーニングする興味深いアイデアです。 推論コストを84.6%削減! 蒸留とエージェントRLは冗談ではありません! 私のメモは次のとおりです。
85.36K