Документ TRM кажется значительным прорывом в области ИИ. Он разрушает парато-фронт на бенчмарках ARC AGI 1 и 2 (а также в решении Судоку и Лабиринтов) с оценочной стоимостью < $0.01 за задачу и стоимостью < $500 для обучения модели 7M на 2 H100 в течение 2 дней. [Специфика обучения и тестирования] Для ARC он обучался на 160 примерах из ConceptARC. Во время тестирования он использует наиболее распространенный ответ из 1000 увеличений и встраивает фиксированную форму задачи в ввод. [Последствия для отрасли] Большинство компаний ИИ сегодня используют универсальные LLM с подсказками для задач. Для конкретных задач меньшие модели могут быть не только дешевле, но и гораздо более качественными! Стартапы могли бы (и должны) обучать модели за < $1000 для конкретных "фиксированных" подзадач (например, извлечение конкретных PDF, прогнозирование временных рядов и т.д.) и использовать это как инструмент для общей модели, чтобы не только повысить производительность, но и создать значимый ИП в задаче, которую они пытаются автоматизировать.
Источник:
26,17K