Boom! MLX-evaluatie met batch-inferentie parallel verdeeld over 2 M3 Ultra en 1 M4 Max! Momenteel worden verzoeken gelijkmatig verdeeld over alle knooppunten in de ring, ik ga hiermee spelen om ze toe te wijzen op basis van de grootte van elk knooppunt 💪🏻