схоже, що найближчі кілька років розвитку штучного інтелекту будуть багато RL з функціями винагороди LLM-as-a-judge. Дивні часи, в які ми живемо Де я можу дізнатися більше про цю парадигму? Які блоги та газети є найбільш релевантними?
135,77K