Das TRM-Papier fühlt sich wie ein bedeutender Durchbruch im Bereich KI an. Es zerstört die Pareto-Front auf den ARC AGI 1 und 2 Benchmarks (sowie beim Lösen von Sudoku und Labyrinthen) mit geschätzten Kosten von < 0,01 $ pro Aufgabe und Kosten von < 500 $, um das 7M-Modell auf 2 H100s für 2 Tage zu trainieren. [Trainings- und Testdetails] Für ARC wurde es mit 160 Beispielen aus ConceptARC trainiert. Zur Testzeit verwendet es die häufigste Antwort von 1000 Augmentierungen zur Testzeit und bettet eine feste Form der Aufgabe in die Eingabe ein. [Branchenimplikationen] Die meisten KI-Unternehmen verwenden heute allgemeine LLMs mit Aufforderungen für Aufgaben. Für spezifische Aufgaben könnten kleinere Modelle nicht nur günstiger, sondern auch von viel höherer Qualität sein! Startups könnten (und sollten) Modelle für < 1000 $ für spezifische "feste Länge"-Unteraufgaben (spezifische PDF-Extraktion, Zeitreihenprognose usw.) trainieren und es als Werkzeug für das allgemeine Modell verwenden, um nicht nur die Leistung zu steigern, sondern auch bedeutendes IP in der Aufgabe aufzubauen, die sie zu automatisieren versuchen.
Quelle:
26,16K