新しいオープンソースGrok 2.5に取り組んでいます! すでにホットロッドで打つことができました!! まだ初期段階であり、失敗するかもしれませんが、私たちが持っているのは次のとおりです。 268B MoE、131kコンテキスト、8人のエキスパート、RoPE、64KVヘッドを備えた8つのGQAアテンションヘッド、64層。 通常、常時2人の専門家だけがアクティブです。わずかなパフォーマンスの低下、わずかな GPU メモリの約 1/3 の増加、品質出力の驚くべき向上で、同時に 4 をアクティブにする方法を見つけました。 それが私たちのテストに耐えられる場合は、詳細なハウツーを公開します。
Brian Roemmele
Brian Roemmele8月24日 09:08
この記事を書き直して、新しい無料オープンソース@xai @Grok 2.5のコンパクトバージョンを使用する予定です。 コンピューターでプライベート非クラウドで使用できるように、データのモデルを微調整する方法を紹介します。 これにより、品質が大幅に向上します。 取り組んでいます...
44.47K