Chạy một phép suy diễn 70B với một GPU 4GB duy nhất