Существуют ли приличные модели с действительно высоким количеством токенов в секунду, которые отстают от текущих SOTA моделей по возможностям всего на 6-12 месяцев? Думаю, я мог бы смириться с потерей интеллекта, если смогу запускать их локально и получать очень быстрые отклики, сделать взаимодействие с агентом более похожим на сочетание клавиш vim, чем на разговор.