Bum! Avaliação MLX com inferência em lote paralela distribuída em 2 M3 Ultra e 1 M4 Max! Atualmente, as solicitações são distribuídas igualmente em todos os nós do anel, vou brincar com isso para atribuí-las com base no tamanho de 💪🏻 cada nó