Бум! MLX eval з паралельним пакетним висновком розподілений на 2 M3 Ultra і 1 M4 Max! В даний час запити рівномірно розподілені по всіх вузлах в кільці, я пограю з цим, щоб призначити їх на основі розміру кожного вузла 💪🏻