Boom! Evaluare MLX cu inferență în lot în paralel distribuită pe 2 M3 Ultra și 1 M4 Max! În prezent, cererile sunt distribuite în mod egal pe toate nodurile din inel, mă voi juca cu asta pentru a le atribui în funcție de dimensiunea fiecărui nod 💪🏻