使用單個 4GB GPU 執行 70B 推理