Токенізація стала останнім бар'єром на шляху до дійсно наскрізних мовних моделей. Ми розробили H-Net: ієрархічну мережу, яка замінює токенізацію динамічним процесом фрагментації безпосередньо всередині моделі, автоматично виявляючи та керуючи значущими одиницями даних
Ми неймовірно раді побачити, як H-Nets дозволить моделям навчатися ефективніше, з меншою кількістю апріорів і попередньою обробкою, у всіх можливих модальностях! Ця робота була створена у співпраці з @cartesia_ai 10/10
653,35K