Бум! Оценка MLX с пакетным выводом, параллельно распределённым на 2 M3 Ultra и 1 M4 Max! В настоящее время запросы равномерно распределены по всем узлам в кольце, я поиграю с этим, чтобы назначить их в зависимости от размера каждого узла 💪🏻