標記化一直是實現真正端到端語言模型的最後障礙。 我們開發了 H-Net:一個層次化網絡,將標記化替換為模型內部的動態分塊過程,自動發現並操作有意義的數據單元。
我們非常高興看到 H-Nets 將如何讓模型在各種模式中更有效地學習,減少先驗和預處理! 這部作品是與@cartesia_ai合作的 10/10
653.33K