Boom ! Évaluation MLX avec inférence par lot parallèle distribuée sur 2 M3 Ultra et 1 M4 Max ! Actuellement, les requêtes sont également réparties sur tous les nœuds dans l'anneau, je vais jouer avec cela pour les assigner en fonction de la taille de chaque nœud 💪🏻