確實。MLX遠不止於LLM推理。 對於這個DTM工作負載,MLX的吞吐量約為NumPy的8.8倍(延遲降低約89%) 用於梁撓度分析的差分變換方法(DTM)。
Awni Hannun
Awni Hannun8月25日 02:09
我經常發布關於LLM的內容,但MLX遠不止是一個LLM推理框架。 了解其眾多功能的好方法是我們為WWDC 25製作的介紹視頻:
3.67K