Рады поделиться своими мыслями о нашей работе над эффективным рассуждением @LiquidAI_ : Мы превращаем общую модель чата 1.3B в мощное математическое рассуждение, которое остается лаконичным. SFT на курируемых трассах CoT открывает надежные рассуждения, а целенаправленный RL контролирует многословность. Рецепт прост и предоставляет интересную точку данных для моделей, не основанных на Qwen. Это по-прежнему основано на нашем первом поколении LFM - с нетерпением ждем следующего поколения! Подробности читайте в нашем блоге!
@LiquidAI_
4,15K