来帮助我们为 @PerplexityComet 构建 RL 环境。必须之前有过专业经验,理想情况下是为 LLM/MLLM 工作过。私信开放。
24.7K