Dokument TRM wydaje się być znaczącym przełomem w dziedzinie AI. Niszczy granicę Pareto w benchmarkach ARC AGI 1 i 2 (oraz w rozwiązywaniu Sudoku i labiryntów) przy szacunkowym koszcie < 0,01 USD za zadanie i koszcie < 500 USD na wytrenowanie modelu 7M na 2 H100 przez 2 dni. [Szczegóły dotyczące treningu i testów] Dla ARC, wytrenowano na 160 przykładach z ConceptARC. W czasie testu używa najczęstszej odpowiedzi z 1000 augmentacji i osadza stały kształt zadania w wejściu. [Implikacje dla przemysłu] Większość firm AI dzisiaj używa ogólnych LLM z podpowiedziami do zadań. Dla konkretnych zadań, mniejsze modele mogą być nie tylko tańsze, ale znacznie wyższej jakości! Startupy mogłyby (i powinny) trenować modele za < 1000 USD dla konkretnych "stałych" podzadań (konkretne wydobycie PDF, prognozowanie szeregów czasowych itp.) i używać ich jako narzędzia do ogólnego modelu, aby nie tylko zwiększyć wydajność, ale także zbudować znaczące IP w zadaniu, które próbują zautomatyzować.
Źródło:
26,15K