Høykonjunktur! MLX-evaluering med batchinferens parallelt fordelt på 2 M3 Ultra og 1 M4 Max! Foreløpig er forespørsler likt fordelt på alle noder i ringen, jeg leker med dette for å tildele dem basert på størrelsen på hver node 💪🏻