TRM 论文感觉像是一个重大的 AI 突破。 它在 ARC AGI 1 和 2 基准(以及数独和迷宫求解)上摧毁了帕累托前沿,任务成本估计低于 $0.01,训练 7M 模型在 2 个 H100 上花费不到 $500,持续 2 天。 [训练和测试细节] 对于 ARC,它在 ConceptARC 上训练了 160 个示例。在测试时,它使用 1000 次增强中最常见的答案,并在输入中嵌入任务的固定形状。 [行业影响] 如今大多数 AI 公司使用通用 LLM 通过提示来完成任务。对于特定任务,较小的模型不仅可能更便宜,而且质量更高!初创公司可以(并且应该)为特定的“固定长度”子任务(特定的 PDF 提取、时间序列预测等)训练成本低于 $1000 的模型,并将其作为通用模型的工具,不仅提升性能,还在他们试图自动化的任务上建立一些有意义的知识产权。
来源:
26.16K