En effet. MLX est bien plus qu'une simple inférence LLM. MLX offre environ 8,8 fois le débit de NumPy pour cette charge de travail DTM (≈89 % de latence en moins) Méthode de Transformation Différentielle (DTM) pour l'analyse de la déflexion des faisceaux.
Awni Hannun
Awni Hannun25 août, 02:09
Je publie beaucoup sur les LLM, mais MLX est bien plus qu'un simple cadre d'inférence LLM. Une bonne façon d'en apprendre davantage sur ses nombreuses fonctionnalités est la vidéo d'introduction que nous avons réalisée pour WWDC 25 :
3,58K