Realmente. MLX é muito mais do que inferência LLM. O MLX oferece ~8,8× a taxa de transferência do NumPy para essa carga de trabalho do DTM (latência ≈89% menor) Método de transformação diferencial (DTM) para análise de deflexão do feixe.
Awni Hannun
Awni Hannun25 de ago., 02:09
Eu posto muito sobre LLMs, mas MLX é muito mais do que uma estrutura de inferência LLM. Uma boa maneira de aprender mais sobre seus muitos recursos é o vídeo de introdução que fizemos para a WWDC 25:
3,66K