Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Результати моделі Tiny Recursion Model (TRM) на ARC-AGI
- ARC-AGI-1: 40%, $1,76/завдання
- ARC-AGI-2: 6,2%, $2,10/завдання
Дякуємо @jm_alexia за внесок у TRM, добре написане, з відкритим вихідним кодом та ретельне дослідження для спільноти, засноване на HRM від @makingAGI

Дякую @k_schuerholt за відтворення цих результатів для ARC Prize, які були засновані на його попередньому аналізі HRM
Наші контрольні точки відтвореної моделі та інструкції з відтворення доступні на @huggingface
Наші примітки:
- TRM має вищий час роботи, ніж HRM, хоча він менший. Наша гіпотеза полягає в тому, що зворотне поширення відбувається на всіх етапах, тоді як HRM робить лише часткові кроки
Відкрите питання: Чи TRM кращий, тому що він розумніший? Або тому, що він тренується довше? Якби ви використовували фіксовані обчислення для обох, продуктивність була б однаковою?
- Чи є TRM такою ж стійкою до кількості збільшень, як і HRM?
- Цікаве перемикання з лінійних шарів на увагу, на меншому завданні увага виконується гірше. Чому?
Він може бути менш ефективним з обчислювальної точки зору, але чому він набагато гірший у Лабіринті?
Наш заклик до спільноти: Розділене попереднє навчання та висновок у TRM
В даний час попереднє навчання і висновок поєднуються в ТРМ. Додаткові партії завдань потрібно знову ж таки попередньо тренувати.
Цей доповнений TRM, швидше за все, зможе працювати на Kaggle для ARC Prize 2025
Витрати на розмноження:
* ARC-AGI-1 Громадський: 9 год 52 хв 6 * 2x8 год * 8 доларів США / год = 157,86 доларів США
* ARC-AGI-1 Напівприватний: 11 год 23 хв * 2х8 год 100 * 8 доларів США / год = 176,38 доларів США
* ARC-AGI-1 Громадський: 9 год 35 хв * 3х8 год 100 * 8 доларів США / год = 216,58 доларів США
* ARC-AGI-2 Напівприватний: 10 год 30 хв * 3х8 год 100 * 8 доларів США / год = 252 $
257,08K
Найкращі
Рейтинг
Вибране