効率的な推論に関する私たちの研究に関する洞察を共有できることを嬉しく思います@LiquidAI_: 1.3B の一般的なチャット モデルを、簡潔なままの強力な数学推論ツールに変えます。キュレーションされたCoTトレースのSFTは、強力な推論を解き放ち、ターゲットを絞ったRLは冗長さを制御します。 レシピはシンプルで、Qwen ベースではないモデルに興味深いデータポイントを提供します。これはまだ当社の第一世代のLFMに基づいています-次世代に興奮しています! 詳細はブログ記事をご覧ください。
@LiquidAI_
4.15K