Entusiasta di condividere approfondimenti sul nostro lavoro sul ragionamento efficiente @LiquidAI_ : Trasformiamo un modello di chat generale da 1,3 miliardi in un forte ragionatore matematico che rimane conciso. La SFT su tracce CoT curate sblocca un ragionamento forte e un RL mirato controlla la verbosità. La ricetta è semplice e fornisce un punto dati interessante per i modelli non basati su Qwen. Questo si basa ancora sulla nostra prima generazione di LFM - entusiasta della prossima generazione! Trovate i dettagli nel nostro blog-post!
@LiquidAI_
4,14K