🚀Har du noen gang lurt på hvordan du kan få RL til å fungere på umulige vanskelige oppgaver der pass@k = 0 %? 🤔 I vårt nye arbeid deler vi RL Grokking-oppskriften: en opplæringsoppskrift som gjør det mulig for LLM-er å løse tidligere uløselige kodeproblemer! Jeg kommer til #CoLM2025 neste uke, så glad for å prate om det! Vi dykker også ned i den opphetede debatten: skjerper RL bare tidligere lærte ferdigheter, eller kan det låse opp virkelig nye resonnementer? 🔥🔥 Les hele bloggen her: #AI #RL #NLP #reinforcementlearning #llm