Boom! Valutazione MLX con inferenza batch parallela distribuita su 2 M3 Ultra e 1 M4 Max! Attualmente le richieste sono equamente distribuite tra tutti i nodi nel ring, giocherò con questo per assegnarle in base alla dimensione di ciascun nodo 💪🏻