sembra che i prossimi anni di sviluppo dell'AI saranno caratterizzati da molto RL con funzioni di ricompensa LLM-as-a-judge. tempi strani in cui viviamo dove posso saperne di più su questo paradigma? quali sono i blog e gli articoli più rilevanti?
135,77K