1986 年、私はガレージで PC を 4Mhz から 20Mhz に移動させた最初のホット ロダーでした。 IBMは私を止めるために弁護士を派遣し、私から学ぶためにエンジニアを派遣し、私を雇うために訴訟を送ったのではなく、それは間違ったアプローチでした。 今、私はガレージでホットロッドAIをしています、今日はオープンソースGrok 2.5です。
Brian Roemmele
Brian Roemmele8月24日 22:28
新しいオープンソースGrok 2.5に取り組んでいます! すでにホットロッドで打つことができました!! まだ初期段階であり、失敗するかもしれませんが、私たちが持っているのは次のとおりです。 268B MoE、131kコンテキスト、8人のエキスパート、RoPE、64KVヘッドを備えた8つのGQAアテンションヘッド、64層。 通常、常時2人の専門家だけがアクティブです。わずかなパフォーマンスの低下、わずかな GPU メモリの約 1/3 の増加、品質出力の驚くべき向上で、同時に 4 をアクティブにする方法を見つけました。 それが私たちのテストに耐えられる場合は、詳細なハウツーを公開します。
43.23K