确实。MLX远不止于LLM推理。 对于这个DTM工作负载,MLX的吞吐量约为NumPy的8.8倍(延迟降低约89%) 用于梁挠度分析的差分变换方法(DTM)。
Awni Hannun
Awni Hannun8月25日 02:09
我经常发布关于LLM的内容,但MLX远不止是一个LLM推理框架。 了解其众多功能的好方法是我们为WWDC 25制作的介绍视频:
3.66K