标记化一直是实现真正端到端语言模型的最后障碍。 我们开发了H-Net:一个分层网络,它在模型内部用动态分块过程替代了标记化,自动发现并处理有意义的数据单元。
我们非常高兴看到 H-Nets 将如何让模型在各种模式中更有效地学习,减少先验和预处理! 这部作品是与@cartesia_ai合作的 10/10
653.33K