La tokenizzazione è solo un caso speciale di "chunking" - la costruzione di dati di basso livello in astrazioni di alto livello - che è a sua volta fondamentale per l'intelligenza. La nostra nuova architettura, che consente la suddivisione gerarchica in blocchi dinamici, non solo è priva di tokenizzatore, ma semplicemente si adatta meglio.
Sukjun (June) Hwang
Sukjun (June) Hwang12 lug 2025
Tokenization has been the final barrier to truly end-to-end language models. We developed the H-Net: a hierarchical network that replaces tokenization with a dynamic chunking process directly inside the model, automatically discovering and operating over meaningful units of data
Questo è stato un progetto incredibilmente importante per me: volevo risolverlo da anni, ma non avevo idea di come. Tutto questo è stato @sukjun_hwang e @fluorane un lavoro straordinario! Ho scritto della storia del suo sviluppo e di ciò che potrebbe accadere dopo. La rete H:
194,75K