Jalankan inferensi 70B dengan GPU 4GB tunggal